Искра. Мгновенный анализ данных
- Время доставки: 7-10 дней
- Состояние товара: новый
- Доступное количество: 15
Оплачивая «Искра. Мгновенный анализ данных» данный товар из каталога «Программирование», вы можете получить дополнительную скидку 4%, если произведете 100% предоплату. Размер скидки вы можете увидеть сразу при оформлении заказа на сайте. Внимание!!! Скидка распространяется только при заказе через сайт.
Искра. Мгновенный анализ данных. Издание II
Авторы: Жюль С. Дамджи, Брук Вениг, Татхагата Дас, Денни Ли
Издатель: Helion
Год публикации: 2023
Переводчик: Роберт Гурчиньский
ISBN: 9788328399143
Формат: 165x235
Серия: O'Reilly
Переплет: мягкий
Страниц: 360
Книга новая
Цена обложки книги: злотых 89.00 > Акционную цену вы найдете на нашем аукционе!
Apache Spark — это программное обеспечение с открытым исходным кодом, предназначенное для кластерной обработки данных, поставляемых в различных форматах. Он позволяет достичь беспрецедентной производительности и позволяет работать в пакетном и потоковом режиме. Эта платформа также хорошо подготовлена для запуска сложных приложений, включая алгоритмы машинного обучения и прогнозного анализа. Все это делает Apache Spark отличным выбором для разработчиков, занимающихся большими данными, их интеллектуальным анализом и анализом.
Эта книга предназначена для инженеров по данным и разработчиков, которые хотят использовать Spark для выполнения сложного анализа данных и использования алгоритмов машинного обучения, даже если данные поступают из разных источников. В нем объясняется, как читать и объединять большие объемы информации с помощью Apache Spark для создания надежных озер данных, как выполнять интерактивные запросы SQL, как создавать конвейеры с помощью MLlib и развертывать модели с помощью MLflow. Также обсуждается совместимость приложения Spark с его распределенными компонентами и режимы его реализации в конкретных средах.
В книге:
- Структурированный API для Python, SQL, Scala и Java
- Операции Spark и механизм SQL
- Конфигурации Spark и интерфейс Spark UI
- Подключение к источникам данных: JSON, Parquet, CSV, Avro, ORC, Hive, S3 и Kafka
- аналитические операции с пакетными и потоковыми данными
- надежные конвейеры данных и конвейеры машинного обучения
Spark: создавайте масштабируемые и надежные приложения для обработки больших данных!
Жюль С. Дамджи — инженер-программист во многих ведущих компаниях, таких как Netscape, Sun Microsystems, Verisign и ProQuest. Занимается распределенными системами.
Брук Вениг — возглавляет команду, занимающуюся разработкой конвейеров машинного обучения. Также проводит обучение в области распределенного машинного обучения.
Татхагата Дас — член комитета по управлению проектом Apache Spark. Он работает над структурированной потоковой передачей и Delta Lake.
Денни Ли — занимается распределенными системами и разработкой данных, особенно для отрасли здравоохранения.
