Zaawansowana analiza danych w PySpark. Metody
- Час доставки: 7-10 днів
- Стан товару: новий
- Доступна кількість: 8
Заказывая «Zaawansowana analiza danych w PySpark. Metody» данный товар из каталога «E-бизнес», вы можете получить дополнительную скидку 4%, если произведете 100% предоплату. Размер скидки вы можете увидеть сразу при оформлении заказа на сайте. Внимание!!! Скидка распространяется только при заказе через сайт.
Розширений аналіз даних у PySpark. Широкомасштабні методи обробки інформації за допомогою Python і Spark
Автори: Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
Видавець: Геліон
Рік випуску: 2023
Переклад: Анджей Ватрак
ISBN: 978-83-8322-069-7
Формат: 165x235
Обкладинка: м'яка
Сторінок: 192
Книга нова
Ціна обкладинки книги: 69.00 PLN > акційну ціну можна знайти на нашому аукціоні!
Потреби в аналізі великих наборів даних і витягу з них корисної інформації постійно зростають. Серед інструментів, доступних для цих програм, PySpark, Spark API для Python, є особливо корисним. Apache Spark чудово підходить для аналізу великих наборів даних, а PySpark дозволяє легко інтегрувати Spark зі спеціалізованими інструментами PyData. Але щоб повністю скористатися цими можливостями, вам потрібно розуміти взаємодію між алгоритмами, наборами даних і шаблонами, які використовуються в аналізі даних.
Ось практичний посібник із Spark 3.0, статистичних методів і реальних - світові набори даних. У ньому розглядаються принципи вирішення аналітичних задач за допомогою інтерфейсу PySpark, використовуючи хороші практики програмування Spark. Після прочитання ви зможете легко заглибитися в аналітичні шаблони на основі популярних методів обробки даних, таких як класифікація, кластеризація, фільтрація та виявлення аномалій, що використовуються в геноміці, ІТ-безпеці та фінансах. Додатковою перевагою є описи використання обробки зображень і природної мови. Ще однією перевагою є низка реальних прикладів великих наборів даних та їх розширений аналіз.
Завдяки книзі ви навчитеся:
- модель програмування в екосистемі Spark< /li>
- основні методи, що використовуються в науці про дані
- повна реалізація аналізу великих загальнодоступних наборів даних
- конкретні випадки використання інструментів машинного навчання
- код який ви можете легко адаптувати до своїх потреб
PySpark: системна відповідь на проблеми інженерів даних!