BOOKS - Apache Airflow и конвейеры обработки данных
Apache Airflow и конвейеры обработки данных - Харенслак Б., де Руйтер Дж. 2021 (2022) PDF Язык русскийКонвейеры обработки данных управляют потоком данных с момента их первоначального сбора д BOOKS
ECO~32 kg CO²

2 TON

Views
80843

Telegram
 
Apache Airflow и конвейеры обработки данных
Author: Харенслак Б., де Руйтер Дж.
Year: 2021 (2022)
Format: PDF
File size: 17 мб
Language: RU



Pay with Telegram STARS
The book covers topics such as ETL (Extract, Transform, Load), data integration, data transformation, data quality, and data governance, and provides practical examples and case studies to illustrate the concepts discussed. Book Description: Apache Airflow и конвейеры обработки данных (Apache Airflow and Data Processing Pipelines) is a comprehensive guide to using Apache Airflow in data processing pipelines. This book provides readers with a detailed understanding of how to design, implement, and manage data processing workflows using this powerful tool. The book covers a range of topics, including ETL (Extract, Transform, Load), data integration, data transformation, data quality, and data governance, and offers practical examples and case studies to illustrate the concepts discussed. The book begins by introducing the concept of data processing pipelines and the role that Apache Airflow plays in managing these workflows. It then delves into the details of how to create and manage Airflow tasks, including creating DAGs (Directed Acyclic Graphs), defining task dependencies, and using sensors and operators to handle errors and exceptions. The book also covers the use of Airflow's built-in sensors and operators, as well as how to create custom sensors and operators to meet specific use cases.
Книга охватывает такие темы, как ETL (извлечение, преобразование, загрузка), интеграция данных, преобразование данных, качество данных и управление данными, а также содержит практические примеры и тематические исследования, иллюстрирующие обсуждаемые концепции. Апачский и конвейеры обработки данных Потока воздуха (апачские Трубопроводы Потока воздуха и Обработки данных) является подробным руководством по использованию апачского Потока воздуха в трубопроводах обработки данных. Эта книга дает читателям подробное понимание того, как проектировать, внедрять и управлять рабочими процессами обработки данных с помощью этого мощного инструмента. Книга охватывает ряд тем, включая ETL (Extract, Transform, Load), интеграцию данных, преобразование данных, качество данных и управление данными, а также предлагает практические примеры и тематические исследования для иллюстрации обсуждаемых концепций. Книга начинается с введения концепции конвейеров обработки данных и роли, которую Apache Airflow играет в управлении этими рабочими процессами. Затем в нем подробно рассматриваются способы создания задач Airflow и управления ими, включая создание групп обеспечения доступности баз данных (направленных ациклических графов), определение зависимостей задач, а также использование датчиков и операторов для обработки ошибок и исключений. В книге также рассказывается об использовании встроенных датчиков и операторов Airflow, а также о том, как создавать пользовательские датчики и операторов для удовлетворения конкретных сценариев использования.
''

You may also be interested in:

Работа с базами данных Microsoft SQL Server сценарии практических занятий
Статистика без подвоха Методы критического анализа данных и причинного вывода
Python Pandas на практике. 200 упражнений по анализу данных с решениями и пояснениями
Происхождение личности и интеллекта человека. Опыт обобщения данных классической нейрофизиологии
Графики лгут. Как стать информационно грамотным человеком в мире данных?
Golang для профи. Работа с сетью, многопоточность, структуры данных и машинное обучение с Go
Использование MS SQL Server 2008 Analysis Services для построения хранилищ данных
Теоретический минимум по Big Data. Все что нужно знать о больших данных
Инновации SQL Server 2019. Использование технологий больших данных и машинного обучения
Повышение эффективности систем поддержки принятия решений на основе многомерных хранилищ данных
Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных
Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных
Microsoft SQL Server 2005 Analysis Services. OLAP и многомерный анализ данных
Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных
Бизнес-моделирование и анализ данных. Решение актуальных задач с помощью Microsoft Excel
Golang для профи. Работа с сетью, многопоточность, структуры данных и машинное обучение с Go
Проектирование баз данных в среде Microsoft Office Access 2003, 2007 и 2010
Beginning Apache Hadoop Administration The First Step towards Hadoop Administration and Management
The Mystery on Apache Canyon Drive (A Mystery Searchers Book Book 1)
Сводный каталог (база данных) печатных изданий Русского Зарубежья 1918-1991 годов
Путями истории. Общерусское национальное, духовное и культурное единство на основании данных науки и техники. Т.1 и 2
Изучаем Python программирование игр, визуализация данных, веб-приложения. 3-е изд. дополненное и переработанное
Базовые методы анализа данных учебник и практикум для вузов, 3-е изд., перераб. и доп.
Геронтология in Silico становление новой дисциплины. Математические модели, анализ данных и вычислительные эксперименты
Заставьте данные говорить. Как сделать бизнес-дашборд в Excel. Руководство по визуализации данных
Роль и место Амира Тимура в истории Средней Азии в свете данных письменных источников
Базовые методы анализа данных учебник и практикум для вузов, 3-е изд., перераб. и доп.
Расширенная аналитика с PySpark Практические примеры анализа больших наборов данных с использованием Python и Spark
Расширенная аналитика с PySpark Практические примеры анализа больших наборов данных с использованием Python и Spark
Невидимые женщины Почему мы живем в мире, удобном только для мужчин. Неравноправие, основанное на данных
Прецизионные системы сбора данных семейства MSC12xx фирмы Texas Instruments архитектура, программирование, разработка приложений
Методы и устройства цифровой обработки сигналов. Дискретизация. Квантование. Цифровой анализ сигналов
Термодинамические свойства воды и водяного пара (Справочник. Рек. Гос. службой стандартных справочных данных—2-е изд., перераб. и доп.)
Падение царского режима. Стенографические отчеты допросов и показаний, данных в 1917 г. в Чрезвычайной Следственной Комиссии Временного Правительства (в 7-ми томах) Том 2
Падение царского режима. Стенографические отчеты допросов и показаний, данных в 1917 г. в Чрезвычайной Следственной Комиссии Временного Правительства (в 7-ми томах) Том 7
Падение царского режима. Стенографические отчеты допросов и показаний, данных в 1917 г. в Чрезвычайной Следственной Комиссии Временного Правительства (в 7-ми томах) Том 3
Падение царского режима. Стенографические отчеты допросов и показаний, данных в 1917 г. в Чрезвычайной Следственной Комиссии Временного Правительства (в 7-ми томах) Том 1
Падение царского режима. Стенографические отчеты допросов и показаний, данных в 1917 г. в Чрезвычайной Следственной Комиссии Временного Правительства (в 7-ми томах) Том 6
Социальный портрет репрессированных в РСФСР в ходе Большого террора (1937-1938 гг.) сравнительный анализ баз данных по региональным «Книгам памяти»