BOOKS - Apache Airflow и конвейеры обработки данных
Apache Airflow и конвейеры обработки данных - Харенслак Б., де Руйтер Дж. 2021 (2022) PDF Язык русскийКонвейеры обработки данных управляют потоком данных с момента их первоначального сбора д BOOKS
ECO~32 kg CO²

2 TON

Views
80841

Telegram
 
Apache Airflow и конвейеры обработки данных
Author: Харенслак Б., де Руйтер Дж.
Year: 2021 (2022)
Format: PDF
File size: 17 мб
Language: RU



Pay with Telegram STARS
The book covers topics such as ETL (Extract, Transform, Load), data integration, data transformation, data quality, and data governance, and provides practical examples and case studies to illustrate the concepts discussed. Book Description: Apache Airflow и конвейеры обработки данных (Apache Airflow and Data Processing Pipelines) is a comprehensive guide to using Apache Airflow in data processing pipelines. This book provides readers with a detailed understanding of how to design, implement, and manage data processing workflows using this powerful tool. The book covers a range of topics, including ETL (Extract, Transform, Load), data integration, data transformation, data quality, and data governance, and offers practical examples and case studies to illustrate the concepts discussed. The book begins by introducing the concept of data processing pipelines and the role that Apache Airflow plays in managing these workflows. It then delves into the details of how to create and manage Airflow tasks, including creating DAGs (Directed Acyclic Graphs), defining task dependencies, and using sensors and operators to handle errors and exceptions. The book also covers the use of Airflow's built-in sensors and operators, as well as how to create custom sensors and operators to meet specific use cases.
Книга охватывает такие темы, как ETL (извлечение, преобразование, загрузка), интеграция данных, преобразование данных, качество данных и управление данными, а также содержит практические примеры и тематические исследования, иллюстрирующие обсуждаемые концепции. Апачский и конвейеры обработки данных Потока воздуха (апачские Трубопроводы Потока воздуха и Обработки данных) является подробным руководством по использованию апачского Потока воздуха в трубопроводах обработки данных. Эта книга дает читателям подробное понимание того, как проектировать, внедрять и управлять рабочими процессами обработки данных с помощью этого мощного инструмента. Книга охватывает ряд тем, включая ETL (Extract, Transform, Load), интеграцию данных, преобразование данных, качество данных и управление данными, а также предлагает практические примеры и тематические исследования для иллюстрации обсуждаемых концепций. Книга начинается с введения концепции конвейеров обработки данных и роли, которую Apache Airflow играет в управлении этими рабочими процессами. Затем в нем подробно рассматриваются способы создания задач Airflow и управления ими, включая создание групп обеспечения доступности баз данных (направленных ациклических графов), определение зависимостей задач, а также использование датчиков и операторов для обработки ошибок и исключений. В книге также рассказывается об использовании встроенных датчиков и операторов Airflow, а также о том, как создавать пользовательские датчики и операторов для удовлетворения конкретных сценариев использования.
''

You may also be interested in:

White Apache|s Woman (Santa Fe Trilogy, #2)
Once They Moved Like The Wind : Cochise, Geronimo, And The Apache Wars
The People and Culture of the Apache (First Peoples of North America)
Apache Reservation: Indigenous Peoples and the American State
The Apache Ignite book The next phase of the distributed systems
Run Your Own Web Server Using Linux & Apache
Beginning PHP5, Apache, and MySQL Web Development
Getting Started with Impala Interactive SQL for Apache Hadoop
Apache Cassandra Horizontal scalability for Java applications
Sidney|s Triple Shot (Apache Crossing #1)
Western Apache Heritage: People of the Mountain Corridor
Apache AH-64 Boeing (McDonnell Douglas) 1976-2005
Machine Learning with Apache Spark (Early Release)
House of Apache Fires (Brothers in War Book 1)
Apache Flume Distributed Log Collection for Hadoop
Apache Warrior vs US Cavalryman 1846-1886 (Osprey Combat 19)
Apacheria: True Stories of Apache Culture 1860-1920
Apacheria True Stories of Apache Culture 1860-1920
Learning Apache OpenWhisk Developing Open Serverless Solutions
Graph Algorithms Practical Examples in Apache Spark and Neo4j
Black Rock Guardian (Apache Protectors: Wolf Den #4)
The Wrath of Cochise: The Bascom Affair and the Origins of the Apache Wars
Apache Sqoop Cookbook Unlocking Hadoop for Your Relational Database
Chevato The Story of the Apache Warrior Who Captured Herman Lehmann
Администрирование Web-сервера Apache и руководство по электронной коммерции
Professional LAMP Linux, Apache, MySQL and PHP5 Web Development
Графовые алгоритмы. Практическая реализация на платформах Apache Spark и Neo4j
Apache Inside the Cockpit of the World|s Most Deadly Fighting Machine
Riding With Cochise The Apache Story of America|s Longest War
Mastering Apache Pulsar Cloud Native Event Streaming at Scale
Графовые алгоритмы. Практическая реализация на платформах Apache Spark и Neo4j
Apache Cassandra Horizontal scalability for Java applications (2022 Update)
Riding With Cochise: The Apache Story of America|s Longest War
Apache at War Flying the World|s Deadliest Attack Helicopter in Combat
Apache at War Flying the World|s Deadliest Attack Helicopter in Combat
Apache at War Flying the World|s Deadliest Attack Helicopter in Combat
Learning Apache Drill Query and Analyze Distributed Data Sources with SQL
FROM AUSTER TO APACHE The History of 656 Squadron RAF/AAC 1942-2012
Stream Processing with Apache Flink Fundamentals, Implementation, and Operation of Streaming Applications
TM 1-1520-238-10 Operator|s Manual for Helicopter, Attack, AH-64A Apache