Zaawansowana analiza danych w PySpark. Metody prze
- Час доставки: 7-10 днів
- Стан товару: новий
- Доступна кількість: 1
Оплачивая «Zaawansowana analiza danych w PySpark. Metody prze», вы можете быть уверены, что данное изделие из каталога «E-бизнес» будет доставлено из Польши и проверено на целостность. В цене товара, указанной на сайте, учтена доставка из Польши. Внимание!!! Товары для Евросоюза, согласно законодательству стран Евросоюза, могут отличаться упаковкой или наполнением.
Розширений аналіз даних у PySpark. Широкомасштабні методи обробки інформації за допомогою Python і Spark
Геліон Глівіце
Ean:9788383220697
- ISBN: 9788383220697
- Автор: Акаш Тандон, Сенді Райза, Урі Лезерсон, Шон Оуен, Джош Уіллс
- Обкладинка: м'яка
- Рік видання: 2023
- Формат: b5 li>
- Сторінок: 192
Потреби в аналізі великих масивів даних і витягу з них корисної інформації постійно зростають. Серед інструментів, доступних для цих програм, PySpark, Spark API для Python, є особливо корисним. Apache Spark чудово підходить для аналізу великих наборів даних, а PySpark дозволяє легко інтегрувати Spark зі спеціалізованими інструментами PyData. Однак, щоб повністю скористатися цими можливостями, необхідно розуміти взаємодію між алгоритмами, наборами даних і шаблонами, які використовуються в аналізі даних.
Ось практичний посібник із Spark 3.0, статистичних методів і реальних наборів даних. У ньому розглядаються принципи розв’язання аналітичних задач за допомогою інтерфейсу PySpark із використанням належних практик програмування Spark. Після прочитання ви зможете легко заглибитися в аналітичні шаблони на основі популярних методів обробки даних, таких як класифікація, кластеризація, фільтрація та виявлення аномалій, що використовуються в геноміці, ІТ-безпеці та фінансах. Додатковою перевагою є описи використання обробки зображень і природної мови. Ще однією перевагою є низка реальних прикладів великих наборів даних і їх розширений аналіз.
Завдяки книзі ви дізнаєтесь:
- Модель програмування екосистеми Spark
- основні методи, які використовуються в науці про дані
- повне впровадження аналізу великих публічних наборів даних
- конкретні випадки використання інструментів машинного навчання
- код, який можна легко адаптувати до своїх потреб
PySpark: системна відповідь на проблеми розробників даних!