Искра. Мгновенный анализ данных v.2 Работа над коллективной брошюрой Helion
- Время доставки: 7-10 дней
- Состояние товара: новый
- Доступное количество: 1
Заказывая «Искра. Мгновенный анализ данных v.2 Работа над коллективной брошюрой Helion» данный товар из каталога «Базы данных» вы можете быть уверены, что после оформления заказа, доставки в Украину, вы получите именно то, что заказывали, в оговоренные сроки и европейского качества.
Искра. Мгновенный анализ данных v.2 (книга)
- Автор: коллектив
- Издательство: Helion
- Год издания: 2023
- Обложка: брошюра
- Количество страниц: 360
- Формат: 235 x 165 мм
- Штрих-код (EAN): 9788328399143
Книга «Spark. Мгновенный анализ данных v.2» - описание
Apache Spark — программное обеспечение с открытым исходным кодом, предназначенное для кластерной обработки данных, поставляемых в различных форматах. Он позволяет достичь беспрецедентной производительности и позволяет работать в пакетном и потоковом режиме. Эта платформа также хорошо подготовлена для запуска сложных приложений, включая алгоритмы машинного обучения и прогнозного анализа. Все это делает Apache Spark отличным выбором для разработчиков, занимающихся большими данными, интеллектуальным анализом и анализом данных. **** Эта книга предназначена для инженеров по данным и разработчиков, которые хотят использовать Spark для выполнения сложного анализа данных и использования алгоритмов машинного обучения, даже если данные поступают из разных источников. В нем объясняется, как читать и объединять большие объемы информации с помощью Apache Spark для создания надежных озер данных, как выполнять интерактивные запросы SQL, как создавать конвейеры с помощью MLlib и развертывать модели с помощью MLflow. Также обсуждается совместимость приложений Spark с его распределенными компонентами и режимы его реализации в конкретных средах. В книге: Структурные API для операций Spark на Python, SQL, Scala и Java, а также конфигурации Spark движка SQL и пользовательский интерфейс Spark, подключающийся к источникам данных: JSON, Parquet, CSV, Avro, ORC, Hive, S3 и Kafka. Аналитические операции с пакетными и потоковыми данными. Надежные конвейеры данных и конвейеры обучения. MachineSpark: создавайте масштабируемые и надежные приложения для работы с большими данными!
