Искра. Мгновенный анализ данных


Код: 17121896024
1226 грн
Цена указана с доставкой в Украину
Товар есть в наличии
КАК ЭКОНОМИТЬ НА ДОСТАВКЕ?
Заказывайте большое количество товаров у этого продавца
Информация
  • Время доставки: 7-10 дней
  • Состояние товара: новый
  • Доступное количество: 15

Оплачивая «Искра. Мгновенный анализ данных» данный товар из каталога «Программирование», вы можете получить дополнительную скидку 4%, если произведете 100% предоплату. Размер скидки вы можете увидеть сразу при оформлении заказа на сайте. Внимание!!! Скидка распространяется только при заказе через сайт.

Искра. Мгновенный анализ данных. Издание II

Авторы: Жюль С. Дамджи, Брук Вениг, Татхагата Дас, Денни Ли

Издатель: Helion

Год публикации: 2023

Переводчик: Роберт Гурчиньский

ISBN: 9788328399143

Формат: 165x235

Серия: O'Reilly

Переплет: мягкий

Страниц: 360

Книга новая

Цена обложки книги: злотых 89.00 > Акционную цену вы найдете на нашем аукционе!

Apache Spark — это программное обеспечение с открытым исходным кодом, предназначенное для кластерной обработки данных, поставляемых в различных форматах. Он позволяет достичь беспрецедентной производительности и позволяет работать в пакетном и потоковом режиме. Эта платформа также хорошо подготовлена ​​для запуска сложных приложений, включая алгоритмы машинного обучения и прогнозного анализа. Все это делает Apache Spark отличным выбором для разработчиков, занимающихся большими данными, их интеллектуальным анализом и анализом.

Эта книга предназначена для инженеров по данным и разработчиков, которые хотят использовать Spark для выполнения сложного анализа данных и использования алгоритмов машинного обучения, даже если данные поступают из разных источников. В нем объясняется, как читать и объединять большие объемы информации с помощью Apache Spark для создания надежных озер данных, как выполнять интерактивные запросы SQL, как создавать конвейеры с помощью MLlib и развертывать модели с помощью MLflow. Также обсуждается совместимость приложения Spark с его распределенными компонентами и режимы его реализации в конкретных средах.

В книге:

  • Структурированный API для Python, SQL, Scala и Java
  • Операции Spark и механизм SQL
  • Конфигурации Spark и интерфейс Spark UI
  • Подключение к источникам данных: JSON, Parquet, CSV, Avro, ORC, Hive, S3 и Kafka
  • аналитические операции с пакетными и потоковыми данными
  • надежные конвейеры данных и конвейеры машинного обучения

Spark: создавайте масштабируемые и надежные приложения для обработки больших данных!

Жюль С. Дамджи — инженер-программист во многих ведущих компаниях, таких как Netscape, Sun Microsystems, Verisign и ProQuest. Занимается распределенными системами.

Брук Вениг — возглавляет команду, занимающуюся разработкой конвейеров машинного обучения. Также проводит обучение в области распределенного машинного обучения.

Татхагата Дас — член комитета по управлению проектом Apache Spark. Он работает над структурированной потоковой передачей и Delta Lake.

Денни Ли — занимается распределенными системами и разработкой данных, особенно для отрасли здравоохранения.