Zaawansowana analiza danych w PySpark. Metody prze


Код: 15176503446
1301 грн
Цена указана с доставкой в Украину
Товар есть в наличии
КАК ЭКОНОМИТЬ НА ДОСТАВКЕ?
Заказывайте большое количество товаров у этого продавца
Информация
  • Время доставки: 7-10 дней
  • Состояние товара: новый
  • Доступное количество: 1

Оплачивая «Zaawansowana analiza danych w PySpark. Metody prze», вы можете быть уверены, что данное изделие из каталога «E-бизнес» будет доставлено из Польши и проверено на целостность. В цене товара, указанной на сайте, учтена доставка из Польши. Внимание!!! Товары для Евросоюза, согласно законодательству стран Евросоюза, могут отличаться упаковкой или наполнением.

Расширенный анализ данных в PySpark. Широкомасштабные методы обработки информации с использованием Python и Spark

Гелион Гливице

Еан: 9788383220697

  • ISBN: 9788383220697
  • Автор: Акаш Тандон, Сэнди Риза, Ури Лазерсон, Шон Оуэн, Джош Уиллс
  • Обложка: мягкая
  • Год издания: 2023
  • Формат: b5 li>
  • Страниц: 192

Потребности в анализе больших наборов данных и извлечении из них полезной информации постоянно растут. Среди инструментов, доступных для этих приложений, особенно полезен PySpark, Spark API для Python. Apache Spark отлично подходит для анализа больших наборов данных, а PySpark упрощает интеграцию Spark со специализированными инструментами PyData. Однако, чтобы в полной мере воспользоваться этими возможностями, необходимо понимать взаимодействие между алгоритмами, наборами данных и шаблонами, используемыми при анализе данных.

Вот практическое руководство по Spark 3.0, статистическим методам и реальным наборам данных. В нем обсуждаются принципы решения аналитических задач с использованием интерфейса PySpark, с использованием передовых практик программирования Spark. После прочтения вы сможете легко углубиться в аналитические закономерности, основанные на популярных методах обработки данных, таких как классификация, кластеризация, фильтрация и обнаружение аномалий, используемых в геномике, ИТ-безопасности и финансах. Дополнительным преимуществом являются описания использования обработки изображений и естественного языка. Еще одним преимуществом является ряд реальных примеров больших наборов данных и их расширенный анализ.

Благодаря книге вы узнаете:

  • Модель программирования экосистемы Spark
  • основные методы, используемые в науке о данных.
  • полная реализация анализа больших наборов общедоступных данных.
  • конкретные варианты использования инструментов машинного обучения.
  • код, который можно легко адаптировать под свои нужды.

PySpark: системный ответ на проблемы инженеров данных!