Аннотация: Apache Airflow и конвейеры обработки данных
Конвейеры обработки данных управляют потоком данных с момента их первоначального сбора до консолидации, очистки, анализа, визуализации и многого другого. Apache Airflow предоставляет единую платформу, которую можно использовать для проектирования, реализации, мониторинга и обслуживания конвейеров. Простота пользовательского интерфейса, возможности plug-and-play и гибкие сценарии Python оптимизируют решение любых задач, касающихся управления данными.
Эта книга научит вас создавать и сопровождать эффективные конвейеры обработки данных. Вы изучите наиболее распространенные модели их использования, особенности ориентированных ациклических графов (ОАГ), которые обеспечивают работу Airflow, а также способы их настройки в соответствии с потребностями вашего конвейера.
Издание предназначено для специалистов по DevOps, обработке и хранению данных, машинному обучению, а также системных администраторов с навыками программирования на Python.
| Автор/составитель | Харенслак Бас, Руйтер Джулиан де |
| Год выпуска | 2021 |
| ISBN | 978-5-97060-970-5 |
| Производитель | ДМК-Пресс |
| Издательство | ДМК-Пресс |
| Количество томов | 1 |
| Количество страниц | 502 |
| Переплет | Твёрдый переплёт |
| Размеры | 245x170x32 мм |
| Цвет | Зелёный |
| Тип бумаги | офсетная (60-220 г/м2) |
| Тип иллюстраций | цветные |
| Формат | 70x100/16 (170x240 мм) |
| Стандарт | 8 |
| Вес | 900 |
| Язык | русский |
