Анализ данных с помощью SQL. Передовые методы трансформации
- Время доставки: 7-10 дней
- Состояние товара: новый
- Доступное количество: 2
Просматривая «Анализ данных с помощью SQL. Передовые методы трансформации» данный товар из каталога «Базы данных» вы можете быть уверены, что после оформления заказа, доставки в Украину, вы получите именно то, что заказывали, в оговоренные сроки и европейского качества.
Анализ данных с помощью SQL. Передовые методы преобразования данных в ценную информацию
Кэти Танимура
SQL был создан как инструмент обработки данных. Хоть его обычно и используют для работы с базами данных, его возможности гораздо шире. Правильный SQL упрощает обработку огромных наборов данных на высоких скоростях. Особенно многообещающей перспективой является использование SQL для больших наборов данных, хранящихся в облаке. Имея несколько более сложные структуры SQL, аналитик данных может извлекать из них знания с большей эффективностью.
Эта практическая книга предназначена для специалистов по данным и специалистов по данным, которые хотят использовать SQL для исследования больших наборов данных. Здесь показаны как популярные, так и чуть менее известные приемы построения SQL-запросов, позволяющие решать даже очень сложные задачи и оптимально использовать свойства этого языка при работе с данными. Такие понятия, как соединения, оконные функции, подзапросы и регулярные выражения, представлены новым и инновационным способом. Продемонстрировал, как комбинировать различные методы для более быстрого достижения целей, используя простой для понимания и читаемый код. Описываемый материал проиллюстрирован многочисленными примерами SQL-запросов, поэтому вы сможете плавно переходить к решению конкретных задач в области обработки, анализа и интеллектуального анализа данных.
Наиболее интересные вопросы:
- подготовка данных для анализа
- анализ временных рядов с использованием SQL
- когортный анализ для изучения происходящих изменений
- анализ текста с использованием расширенных функций и операторов SQL
- обнаружение выбросов
- анализ экспериментов (A/B-тесты)
SQL: вот как можно сделать надежные выводы из данных!
Об авторе книги
Кэти Танимура — аналитик данных с более чем двадцатилетним опытом работы. Ей также удалось создать команды по анализу данных и необходимую инфраструктуру. Она также руководила командами в нескольких ведущих технологических компаниях. Он уже много лет использует SQL для работы с большинством коммерческих и открытых баз данных.
Оглавление:
Предисловие
Глава 1. Анализ с использованием SQL
- Что такое анализ данных?
- Почему SQL?
Что такое SQL?
Преимущества SQL
SQL и R или Python
SQL как элемент анализа данных процесс
- Типы баз данных и способы работы с ними
Строковые базы данных
Столбчатые базы данных
Другие типы инфраструктуры данных
- Краткое содержание
Глава 2. Подготовка данных к анализу
- Типы данных
Типы данных в базах данных
Структурированные данные и неструктурированные
Количественные и качественные данные
Данные из первых, вторых и третьих рук
Разреженные данные
- Структура SQL-запроса
- Профилирование — распределение данных
Гистограммы и частота появления
Биннинг
Техника N-bin
- Профилирование — качество данных
Обнаружение дубликаты
Дедупликация с помощью предложений GROUP BY и DISTINCT
- Подготовка — очистка данных
Очистка данных с помощью преобразований операторов CASE
Преобразование типов и приведение типов
Работа с нулями: функции объединения, nullif и nvl
Отсутствующие данные
- Подготовка — формирование данных
Целевое приложение — бизнес анализ, визуализация, расчет статистики, машинное обучение.
Создание сводных таблиц с помощью операторов CASE.
Восстановление структуры после поворота из
