Zaawansowana analiza danych w PySpark. Metody prze
- Время доставки: 7-10 дней
- Состояние товара: новый
- Доступное количество: 1
Оплачивая «Zaawansowana analiza danych w PySpark. Metody prze», вы можете быть уверены, что данное изделие из каталога «E-бизнес» будет доставлено из Польши и проверено на целостность. В цене товара, указанной на сайте, учтена доставка из Польши. Внимание!!! Товары для Евросоюза, согласно законодательству стран Евросоюза, могут отличаться упаковкой или наполнением.
Расширенный анализ данных в PySpark. Широкомасштабные методы обработки информации с использованием Python и Spark
Гелион Гливице
Еан: 9788383220697
- ISBN: 9788383220697
- Автор: Акаш Тандон, Сэнди Риза, Ури Лазерсон, Шон Оуэн, Джош Уиллс
- Обложка: мягкая
- Год издания: 2023
- Формат: b5 li>
- Страниц: 192
Потребности в анализе больших наборов данных и извлечении из них полезной информации постоянно растут. Среди инструментов, доступных для этих приложений, особенно полезен PySpark, Spark API для Python. Apache Spark отлично подходит для анализа больших наборов данных, а PySpark упрощает интеграцию Spark со специализированными инструментами PyData. Однако, чтобы в полной мере воспользоваться этими возможностями, необходимо понимать взаимодействие между алгоритмами, наборами данных и шаблонами, используемыми при анализе данных.
Вот практическое руководство по Spark 3.0, статистическим методам и реальным наборам данных. В нем обсуждаются принципы решения аналитических задач с использованием интерфейса PySpark, с использованием передовых практик программирования Spark. После прочтения вы сможете легко углубиться в аналитические закономерности, основанные на популярных методах обработки данных, таких как классификация, кластеризация, фильтрация и обнаружение аномалий, используемых в геномике, ИТ-безопасности и финансах. Дополнительным преимуществом являются описания использования обработки изображений и естественного языка. Еще одним преимуществом является ряд реальных примеров больших наборов данных и их расширенный анализ.
Благодаря книге вы узнаете:
- Модель программирования экосистемы Spark
- основные методы, используемые в науке о данных.
- полная реализация анализа больших наборов общедоступных данных.
- конкретные варианты использования инструментов машинного обучения.
- код, который можно легко адаптировать под свои нужды.
PySpark: системный ответ на проблемы инженеров данных!