Zaawansowana analiza danych w PySpark
- Час доставки: 7-10 днів
- Стан товару: новий
- Доступна кількість: 9
Оплачивая «Zaawansowana analiza danych w PySpark» данный товар из каталога «E-бизнес», вы можете получить дополнительную скидку 4%, если произведете 100% предоплату. Размер скидки вы можете увидеть сразу при оформлении заказа на сайте. Внимание!!! Скидка распространяется только при заказе через сайт.
Розширений аналіз даних у PySpark
Колективна робота
- Рік випуску: 2023
- Тип обкладинки: м'яка
- Автор: Колективна робота
- Умова: Новий
- ISBN: 9788383220697
- Розмір: -
- Номер проблеми: -
- Серія: -
- Кількість сторінок: -
- Вага: 0,5 кг
- Індекс: ate-533498
Потреби в аналізі великих масивів даних і витягу з них корисної інформації постійно зростають. Серед інструментів, доступних для цих програм, PySpark, Spark API для Python, є особливо корисним. Apache Spark чудово підходить для аналізу великих наборів даних, а PySpark дозволяє легко інтегрувати Spark зі спеціалізованими інструментами PyData. Однак, щоб повністю скористатися цими можливостями, необхідно розуміти взаємодію між алгоритмами, наборами даних і шаблонами, які використовуються в аналізі даних. Ось практичний посібник із Spark 3.0, статистичних методів і реальних наборів даних. У ньому розглядаються принципи вирішення аналітичних задач за допомогою інтерфейсу PySpark, використовуючи хороші практики програмування Spark. Після прочитання ви зможете легко заглибитися в аналітичні шаблони на основі популярних методів обробки даних, таких як класифікація, кластеризація, фільтрація та виявлення аномалій, що використовуються в геноміці, ІТ-безпеці та фінансах. Додатковою перевагою є описи використання обробки зображень і природної мови. Ще однією перевагою є низка реальних прикладів великих масивів даних та їх розширений аналіз. Завдяки книзі ви дізнаєтеся: про модель програмування в екосистемі Spark, про основні методи, що використовуються в науці про дані, про повну реалізацію аналізу великих загальнодоступних наборів даних, про конкретні випадки використання інструментів машинного навчання, код, який ви можете легко адаптувати до своїх потреб PySpark: системна відповідь на проблеми інженера даних!
