BOOKS - OS AND DB - Data Pipelines with Apache Airflow (MEAP)
Data Pipelines with Apache Airflow (MEAP) - Bas P. Harenslak and Julian Rutger de Ruiter 2020 PDF | EPUB Manning Publications BOOKS OS AND DB
ECO~14 kg CO²

1 TON

Views
639597

 
Data Pipelines with Apache Airflow (MEAP)
Author: Bas P. Harenslak and Julian Rutger de Ruiter
Year: 2020
Pages: 230
Format: PDF | EPUB
File size: 20 MB
Language: ENG



The book begins by introducing the concept of data pipelines and their importance in today's data-driven world. It explains how data pipelines have evolved over time and how they are now an essential part of any organization's data infrastructure. The author highlights the challenges that organizations face when it comes to managing data pipelines, such as complexity, scalability, and reliability issues. The book then delves into the features and capabilities of Apache Airflow, explaining how it can help organizations overcome these challenges and streamline their data pipelines. The next chapter discusses the benefits of using Apache Airflow for data pipelines, including its ability to handle large volumes of data, support for multiple data sources and destinations, and flexibility in terms of customization and integration with other tools. The author also covers the different types of data pipelines that can be built using Apache Airflow, such as ETL (Extract, Transform, Load) pipelines, ELT (Extract, Load, Transform) pipelines, and data streaming pipelines. The following chapters dive deeper into the technical aspects of building and managing data pipelines with Apache Airflow. The author provides step-by-step instructions on how to set up and configure Apache Airflow, as well as how to create and manage data pipelines using the platform. The book also covers advanced topics such as error handling, performance optimization, and security considerations.
Книга начинается с представления концепции конвейеров данных и их важности в современном мире, основанном на данных. В нем объясняется, как конвейеры данных развивались с течением времени и как они теперь являются неотъемлемой частью инфраструктуры данных любой организации. Автор подчеркивает проблемы, с которыми сталкиваются организации при управлении конвейерами данных, такие как сложность, масштабируемость и надежность. Затем книга углубляется в функции и возможности Apache Airflow, объясняя, как он может помочь организациям преодолеть эти проблемы и оптимизировать свои конвейеры данных. В следующей главе обсуждаются преимущества использования Apache Airflow для передачи данных, включая его способность обрабатывать большие объемы данных, поддержку нескольких источников и мест назначения данных, а также гибкость с точки зрения настройки и интеграции с другими инструментами. Автор также описывает различные типы конвейеров данных, которые могут быть построены с использованием Apache Airflow, такие как конвейеры ETL (Extract, Transform, Load), конвейеры ELT (Extract, Load, Transform) и конвейеры потоковой передачи данных. В следующих главах подробно рассматриваются технические аспекты построения и управления конвейерами данных с помощью Apache Airflow. Автор предоставляет пошаговую инструкцию по настройке и конфигурированию Apache Airflow, а также по созданию и управлению конвейерами данных с помощью платформы. В книге также рассматриваются расширенные темы, такие как обработка ошибок, оптимизация производительности и соображения безопасности.
livre commence par une présentation du concept de convoyeurs de données et de leur importance dans le monde d'aujourd'hui basé sur les données. Il explique comment les pipelines de données ont évolué au fil du temps et comment ils font maintenant partie intégrante de l'infrastructure de données de toute organisation. L'auteur souligne les défis auxquels les entreprises sont confrontées dans la gestion des pipelines de données, tels que la complexité, l'évolutivité et la fiabilité. livre explore ensuite les fonctionnalités et les capacités d'Apache Airflow, expliquant comment il peut aider les organisations à surmonter ces problèmes et à optimiser leurs convoyeurs de données. chapitre suivant examine les avantages de l'utilisation d'Apache Airflow pour le transfert de données, y compris sa capacité à traiter de grandes quantités de données, la prise en charge de plusieurs sources et destinations de données, ainsi que la flexibilité en termes de configuration et d'intégration avec d'autres outils. L'auteur décrit également les différents types de convoyeurs de données qui peuvent être construits à l'aide d'Apache Airflow, tels que les convoyeurs ETL (Extract, Bou, Load), ELT (Extract, Load, Bou) et les convoyeurs de flux de données. s chapitres suivants examinent en détail les aspects techniques de la construction et de la gestion des convoyeurs de données avec Apache Airflow. L'auteur fournit des instructions étape par étape sur la configuration et la configuration d'Apache Airflow, ainsi que sur la création et la gestion de pipelines de données à l'aide de la plate-forme. livre traite également de sujets avancés tels que la gestion des erreurs, l'optimisation des performances et les considérations de sécurité.
libro comienza presentando el concepto de transportadores de datos y su importancia en el mundo actual basado en datos. Explica cómo los transportadores de datos han evolucionado con el tiempo y cómo ahora son parte integral de la infraestructura de datos de cualquier organización. autor destaca los desafíos que enfrentan las organizaciones al administrar canalizaciones de datos, como complejidad, escalabilidad y confiabilidad. A continuación, el libro profundiza en las características y capacidades de Apache Airflow, explicando cómo puede ayudar a las organizaciones a superar estos desafíos y optimizar sus transportadores de datos. En el siguiente capítulo se analizan las ventajas de utilizar Apache Airflow para la transferencia de datos, incluyendo su capacidad para procesar grandes cantidades de datos, soporte para múltiples fuentes y destinos de datos, y flexibilidad en términos de configuración e integración con otras herramientas. autor también describe los diferentes tipos de transportadores de datos que se pueden construir utilizando Apache Airflow, como los transportadores ETL (Extract, Transforms, Load), los transportadores ELT (Extract, Load, Transform) y los transportadores de streaming transferencia de datos. siguientes capítulos tratan en detalle los aspectos técnicos de la construcción y gestión de transportadores de datos con Apache Airflow. autor proporciona instrucciones paso a paso para configurar y configurar Apache Airflow, así como para crear y administrar canalizaciones de datos a través de la plataforma. libro también aborda temas avanzados como el manejo de errores, optimización del rendimiento y consideraciones de seguridad.
O livro começa apresentando o conceito das linhas de montagem de dados e sua importância no mundo atual baseado em dados. Ele explica como as linhas de montagem de dados evoluíram ao longo do tempo e como elas agora são parte integrante da infraestrutura de dados de qualquer organização. O autor ressalta os desafios que as organizações enfrentam na gestão das linhas de montagem de dados, como complexidade, escalabilidade e confiabilidade. Em seguida, o livro é aprofundado nas funções e capacidades do Apache Airflow, explicando como ele pode ajudar as organizações a superar esses problemas e otimizar suas linhas de montagem de dados. O capítulo a seguir aborda as vantagens de usar o Apache Airflow para transferir dados, incluindo sua capacidade de processar grandes quantidades de dados, suportar várias fontes e destinos de dados e flexibilidade em termos de configuração e integração com outras ferramentas. O autor também descreve diferentes tipos de linhas de montagem de dados que podem ser construídas com Apache Airflow, tais como as linhas de montagem ETL (Extract, G7, Load), as linhas de montagem ELT (Extract, Load, G7) e as linhas de transmissão de dados. Os capítulos seguintes abordam em detalhe os aspectos técnicos da construção e gerenciamento das linhas de montagem de dados com o Apache Airflow. O autor fornece instruções passo a passo sobre a configuração e configuração do Apache Airflow e sobre a criação e gerenciamento de linhas de montagem de dados por meio da plataforma. O livro também aborda temas avançados, como processamento de erros, otimização de desempenho e questões de segurança.
Il libro inizia presentando il concetto delle reti di trasmissione e la loro importanza nel mondo moderno basato sui dati. Spiega come le reti di montaggio di dati si sono evolute nel corso del tempo e come ora sono parte integrante dell'infrastruttura di dati di qualsiasi organizzazione. L'autore sottolinea i problemi che le aziende devono affrontare nella gestione delle reti di montaggio dati, quali complessità, scalabilità e affidabilità. Quindi il libro approfondisce le funzioni e le funzionalità di Apache Airflow, spiegando come può aiutare le organizzazioni a superare questi problemi e ottimizzare le proprie linee di montaggio dati. Il capitolo seguente affronta i vantaggi dell'utilizzo di Apache Airflow per il trasferimento dei dati, inclusa la capacità di elaborare grandi quantità di dati, il supporto di più origini e destinazioni di dati e la flessibilità in termini di configurazione e integrazione con altri strumenti. L'autore descrive anche i diversi tipi di linee di montaggio che possono essere costruiti utilizzando Apache Airflow, come le linee di montaggio ETL (Extract, Form, Load), le linee di montaggio ELT (Extract, Load, Form) e le linee di montaggio per lo streaming di dati. I seguenti capitoli descrivono in dettaglio gli aspetti tecnici della costruzione e della gestione delle reti dati con Apache Airflow. L'autore fornisce istruzioni passo passo per la configurazione e la configurazione di Apache Airflow e per la creazione e la gestione delle reti di montaggio dati tramite la piattaforma. Il libro affronta anche argomenti avanzati quali la gestione degli errori, l'ottimizzazione delle prestazioni e la sicurezza.
Das Buch beginnt mit der Vorstellung des Konzepts der Datenpipelines und ihrer Bedeutung in der heutigen datengetriebenen Welt. Es erklärt, wie sich die Datenpipelines im Laufe der Zeit entwickelt haben und wie sie heute ein wesentlicher Bestandteil der Dateninfrastruktur jeder Organisation sind. Der Autor betont die Herausforderungen, denen sich Unternehmen bei der Verwaltung von Datenpipelines gegenübersehen, wie Komplexität, Skalierbarkeit und Zuverlässigkeit. Das Buch geht dann auf die Funktionen und Fähigkeiten von Apache Airflow ein und erklärt, wie es Unternehmen helfen kann, diese Herausforderungen zu meistern und ihre Datenpipelines zu optimieren. Das nächste Kapitel beschreibt die Vorteile der Verwendung von Apache Airflow für die Datenübertragung, einschließlich seiner Fähigkeit, große Datenmengen zu verarbeiten, Unterstützung für mehrere Datenquellen und -ziele sowie Flexibilität bei der Konfiguration und Integration mit anderen Tools. Der Autor beschreibt auch die verschiedenen Arten von Datenpipelines, die mit Apache Airflow aufgebaut werden können, wie ETL-Pipelines (Extract, Transform, Load), ELT-Pipelines (Extract, Load, Transform) und Datenstreaming-Pipelines. Die folgenden Kapitel behandeln die technischen Aspekte des Aufbaus und der Verwaltung von Datenpipelines mit Apache Airflow im Detail. Der Autor bietet eine Schritt-für-Schritt-Anleitung zum Einrichten und Konfigurieren von Apache Airflow sowie zum Erstellen und Verwalten von Datenpipelines mithilfe der Plattform. Das Buch behandelt auch erweiterte Themen wie Fehlerbehandlung, istungsoptimierung und cherheitsaspekte.
Książka rozpoczyna się od wprowadzenia koncepcji rurociągów danych i ich znaczenia w dzisiejszym świecie opartym na danych. Wyjaśnia, w jaki sposób rurociągi danych ewoluowały w czasie i w jaki sposób są one obecnie integralną częścią infrastruktury danych jakiejkolwiek organizacji. Autor podkreśla wyzwania, przed jakimi stoją organizacje w zarządzaniu rurociągami danych, takie jak złożoność, skalowalność i niezawodność. Następnie książka zagłębia się w funkcje i możliwości Apache Airflow, wyjaśniając, jak może pomóc organizacjom przezwyciężyć te wyzwania i zoptymalizować rurociągi danych. W następnym rozdziale omówiono korzyści płynące z wykorzystania Apache Airflow do przesyłania danych, w tym możliwość obsługi dużych ilości danych, wsparcie dla wielu źródeł danych i miejsc docelowych oraz elastyczność w zakresie konfiguracji i integracji z innymi narzędziami. Autor opisuje również różnego rodzaju rurociągi danych, które można zbudować za pomocą Apache Airflow, takich jak rurociągi ETL (ekstrakt, transformata, obciążenie), ELT (ekstrakt, obciążenie, przekształcenie) i strumieniowe rurociągi danych. Poniższe rozdziały szczegółowo określają techniczne aspekty budowy i zarządzania rurociągami danych za pomocą Apache Airflow. Autor dostarcza instrukcje krok po kroku dotyczące konfiguracji i konfiguracji Apache Airflow oraz tworzenia i zarządzania rurociągami danych za pomocą platformy. Książka obejmuje również zaawansowane tematy, takie jak obsługa błędów, optymalizacja wydajności i względy bezpieczeństwa.
הספר מתחיל בהצגת הרעיון של צינורות נתונים וחשיבותם בעולם מונע הנתונים של ימינו. זה מסביר איך צינורות מידע התפתחו עם הזמן ואיך הם עכשיו חלק בלתי נפרד מתשתית המידע של כל ארגון. המחבר מדגיש את האתגרים הניצבים בפני הארגונים בניהול צינורות נתונים, כגון מורכבות, קשקשים ואמינות. הספר מתעמק במאפייניו וביכולותיו של Apache Airflow ומסביר כיצד הוא יכול לעזור לארגונים להתגבר על אתגרים אלה ולייעל את צינורות המידע שלהם. הפרק הבא דן ביתרונות של שימוש ב-Apache Airflow להעברת נתונים, כולל היכולת שלה לטפל בכמויות גדולות של נתונים, תמיכה במספר מקורות נתונים ויעדים, וגמישות במונחים של תצורה ואינטגרציה עם כלים אחרים. המחבר גם מתאר סוגים שונים של צינורות נתונים שניתן לבנות באמצעות Apache Airflow, כגון ETL (Extract, Transform, Load), ELT (Extract, Load, Transform) וצינורות מידע זורמים. הפרקים הבאים מפרטים את ההיבטים הטכניים של בניית וניהול צינורות נתונים באמצעות Apache Airflow. המחבר מספק הוראות צעד אחר צעד להגדרות והגדרות של Apache Airflow, כמו גם יצירת וניהול צינורות נתונים באמצעות הפלטפורמה. הספר עוסק גם בנושאים מתקדמים כגון טיפול בשגיאות, אופטימיזציה ביצועית ושיקולי ביטחון.''
Kitap, veri boru hatları kavramını ve bunların günümüzün veri odaklı dünyasındaki önemini tanıtarak başlıyor. Veri boru hatlarının zaman içinde nasıl geliştiğini ve şimdi herhangi bir kuruluşun veri altyapısının ayrılmaz bir parçası olduklarını açıklar. Yazar, kuruluşların karmaşıklık, ölçeklenebilirlik ve güvenilirlik gibi veri boru hatlarını yönetmede karşılaştıkları zorlukları vurgulamaktadır. Kitap daha sonra Apache Airflow'un özelliklerini ve yeteneklerini inceleyerek, kuruluşların bu zorlukların üstesinden gelmelerine ve veri boru hatlarını optimize etmelerine nasıl yardımcı olabileceğini açıklıyor. Bir sonraki bölümde, Apache Airflow'u veri aktarımı için kullanmanın yararları, büyük miktarda veriyi işleme yeteneği, birden fazla veri kaynağı ve varış noktası için destek ve yapılandırma ve diğer araçlarla entegrasyon açısından esneklik de dahil olmak üzere tartışılmaktadır. Yazar ayrıca, ETL (Extract, Transform, Load) boru hatları, ELT (Extract, Load, Transform) boru hatları ve akış veri boru hatları gibi Apache Airflow kullanılarak oluşturulabilecek çeşitli veri boru hatlarını da açıklamaktadır. Aşağıdaki bölümlerde, Apache Airflow'u kullanarak veri boru hatlarının oluşturulması ve yönetilmesinin teknik yönleri ayrıntılı olarak açıklanmaktadır. Yazar, Apache Airflow'u yapılandırmak ve yapılandırmanın yanı sıra platformu kullanarak veri boru hatları oluşturmak ve yönetmek için adım adım talimatlar sağlar. Kitap ayrıca hata işleme, performans optimizasyonu ve güvenlik hususları gibi gelişmiş konuları da kapsar.
يبدأ الكتاب بتقديم مفهوم خطوط أنابيب البيانات وأهميتها في عالم اليوم القائم على البيانات. يشرح كيف تطورت خطوط أنابيب البيانات بمرور الوقت وكيف أصبحت الآن جزءًا لا يتجزأ من البنية التحتية للبيانات لأي مؤسسة. يسلط المؤلف الضوء على التحديات التي تواجهها المنظمات في إدارة خطوط أنابيب البيانات، مثل التعقيد وقابلية التوسع والموثوقية. ثم يتعمق الكتاب في ميزات وقدرات Apache Airflow، موضحًا كيف يمكن أن يساعد المؤسسات في التغلب على هذه التحديات وتحسين خطوط أنابيب البيانات الخاصة بهم. يناقش الفصل التالي فوائد استخدام Apache Airflow لنقل البيانات، بما في ذلك قدرتها على التعامل مع كميات كبيرة من البيانات، ودعم مصادر البيانات والوجهات المتعددة، والمرونة من حيث التكوين والتكامل مع الأدوات الأخرى. يصف المؤلف أيضًا أنواعًا مختلفة من خطوط أنابيب البيانات التي يمكن بناؤها باستخدام Apache Airflow، مثل خطوط أنابيب ETL (الاستخراج والتحويل والحمل) و ELT (الاستخراج والحمل والتحويل) وخطوط أنابيب البيانات المتدفقة. توضح الفصول التالية بالتفصيل الجوانب التقنية لبناء وإدارة خطوط أنابيب البيانات باستخدام Apache Airflow. يقدم المؤلف تعليمات خطوة بخطوة لتكوين وتكوين Apache Airflow، بالإضافة إلى إنشاء وإدارة خطوط أنابيب البيانات باستخدام المنصة. يغطي الكتاب أيضًا مواضيع متقدمة مثل معالجة الأخطاء وتحسين الأداء والاعتبارات الأمنية.
이 책은 오늘날의 데이터 중심 세계에서 데이터 파이프 라인 개념과 그 중요성을 소개함으로써 시작됩니다. 데이터 파이프 라인이 시간이 지남에 따라 어떻게 발전했으며 현재 조직의 데이터 인프라에 없어서는 안될 부분인지 설명합니다. 저자는 복잡성, 확장 성 및 신뢰성과 같은 데이터 파이프 라인 관리에서 조직이 직면 한 문제를 강조합니다. 그런 다음이 책은 Apache Airflow의 기능과 기능을 탐구하여 조직이 이러한 과제를 극복하고 데이터 파이프 라인을 최적화하는 데 도움이되는 방법을 설명합니다. 다음 장에서는 대량의 데이터를 처리하고 여러 데이터 소스 및 대상을 지원하며 구성 및 다른 도구와의 통합 측면에서 유연성을 포함하여 데이터 전송에 Apache Airflow를 사용하는 이점에 대해 설명합니다. 저자는 또한 ETL (Extract, Transform, Load) 파이프 라인, ELT (Extract, Load, Transform) 파이프 라인 및 스트리밍 데이터 파이프 라인과 같은 Apache Airflow를 사용하여 구축 할 수있는 다양한 유형의 데이터 파이프 라인을 설명합니다. 다음 장에서는 Apache Airflow를 사용하여 데이터 파이프 라인을 구축하고 관리하는 기술적 측면을 자세 저자는 Apache Airflow를 구성하고 구성하고 플랫폼을 사용하여 데이터 파이프 라인을 작성하고 관리하기위한 단계별 지침을 제공합니다. 이 책은 또한 오류 처리, 성능 최적화 및 보안 고려 사항과 같은 고급 주제를 다룹니다.
本書は、データパイプラインの概念と、今日のデータドリブンな世界における重要性を紹介することから始まります。データパイプラインが時間をかけてどのように進化してきたか、そしてどのようにしてどのような組織のデータインフラストラクチャの不可欠な部分になっているかを説明します。著者は、複雑さ、スケーラビリティ、信頼性など、データパイプラインの管理において組織が直面する課題を強調しています。この本では、Apache Airflowの機能と機能について詳しく説明し、組織がこれらの課題を克服し、データパイプラインを最適化する方法を説明します。次の章では、データ転送にApache Airflowを使用する利点について説明します。これには、大量のデータを処理する機能、複数のデータソースと目的地のサポート、構成と他のツールとの統合の面での柔軟性が含まれます。また、ETL (Extract、 Transform、 Load)パイプライン、ELT (Extract、 Load、 Transform)パイプライン、ストリーミングデータパイプラインなど、Apache Airflowを使用して構築できるさまざまな種類のデータパイプラインについて説明します。次の章では、Apache Airflowを使用したデータパイプラインの構築と管理の技術的側面について詳しく説明します。著者は、Apache Airflowの設定と構成、ならびにプラットフォームを使用したデータパイプラインの作成と管理に関するステップバイステップの指示を提供します。この本では、エラー処理、パフォーマンスの最適化、セキュリティに関する考慮事項などの高度なトピックについても説明しています。
本書首先介紹了數據輸送機的概念及其在當今基於數據的世界中的重要性。它解釋了數據管道如何隨著時間的推移而發展,以及它們現在如何成為任何組織數據基礎架構的組成部分。作者強調了組織管理數據流水線時面臨的挑戰,例如復雜性,可擴展性和可靠性。該書隨後深入研究了Apache Airflow的功能和功能,解釋了它如何幫助組織克服這些問題並優化其數據管道。下一章討論了使用Apache Airflow進行數據傳輸的好處,包括其處理大量數據的能力,對多個數據源和目的地的支持,以及與其他工具的配置和集成的靈活性。作者還描述了可以使用Apache Airflow構建的不同類型的數據輸送機,例如ETL輸送機(Extract,Transform,Load),ELT輸送機(Extract,Load,Transform)和數據流式輸送機。以下章節詳細介紹了使用Apache Airflow構建和管理數據管道的技術方面。作者提供了有關配置和配置Apache Airflow以及使用平臺創建和管理數據流線的逐步指導。該書還探討了高級主題,例如錯誤處理,性能優化和安全考慮。

You may also be interested in:

Data Pipelines with Apache Airflow (MEAP)
Data Pipelines with Apache Airflow
Data Pipelines with Apache Airflow (Final)
Apache Airflow и конвейеры обработки данных
Apache Airflow и конвейеры обработки данных
Cost-Effective Data Pipelines: Balancing Trade-Offs When Developing Pipelines in the Cloud
Data Engineering for Machine Learning Pipelines From Python Libraries to ML Pipelines and Cloud Platforms
Cost-Effective Data Pipelines Balancing Trade-Offs When Developing Pipelines in the Cloud (Final Release)
Ultimate Big Data Analytics with Apache Hadoop Master Big Data Analytics with Apache Hadoop Using Apache Spark, Hive, and Python
Ultimate Big Data Analytics with Apache Hadoop Master Big Data Analytics with Apache Hadoop Using Apache Spark, Hive, and Python
Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python
Ultimate Data Engineering with Databricks Develop Scalable Data Pipelines Using Data Engineering|s Core Tenets Such as Delta Tables, Ingestion, Transformation, Security, and Scalability
Ultimate Data Engineering with Databricks Develop Scalable Data Pipelines Using Data Engineering|s Core Tenets Such as Delta Tables, Ingestion, Transformation, Security, and Scalability
Data Pipelines Pocket Reference Moving and Processing Data for Analytics (Final)
Data Engineering with AWS: A Comprehensive Guide to Building Robust Data Pipelines
Apache Iceberg The Definitive Guide Data Lakehouse Functionality, Performance, and Scalability on the Data Lake
Apache Iceberg The Definitive Guide Data Lakehouse Functionality, Performance, and Scalability on the Data Lake
Apache Iceberg The Definitive Guide Data Lakehouse Functionality, Performance, and Scalability on the Data Lake
Apache Iceberg: The Definitive Guide: Data Lakehouse Functionality, Performance, and Scalability on the Data Lake
Data Engineering with Scala and Spark: Build streaming and batch pipelines that process massive amounts of data using Scala
Data Engineering with AWS - Second Edition: Acquire the skills to design and build AWS-based data transformation pipelines like a pro
Data Science on the Google Cloud Platform Implementing End-to-End Real-time Data Pipelines from ingest to machine learning
Effective Data Science Infrastructure How to make data scientists productive (MEAP Version 7)
Kafka Connect: Build and Run Data Pipelines
Reproducible Data Science with Pachyderm: Learn how to build version-controlled, end-to-end data pipelines using Pachyderm 2.0
Data Science in Production Building Scalable Model Pipelines with Python
Kafka Connect Build and Run Data Pipelines (12th Early Release)
Snowflake Recipes A Problem-Solution Approach to Implementing Modern Data Pipelines
Big Data Processing with Apache Spark
Think Like a Data Analyst (MEAP v3)
Everyday Data Visualization (MEAP v5)
Grokking Data Structures (MEAP v6)
Grokking Data Structures (MEAP v6)
Effective Data Analysis (MEAP V9)
Grokking Data Structures (MEAP v6)
Learning Apache Drill Query and Analyze Distributed Data Sources with SQL
Data Science on AWS Implementing End-to-End, Continuous AI and Machine Learning Pipelines
High Performance Python for Data Analytics (MEAP)
Algorithms and Data Structures in Action (MEAP V12)
Data Storytelling with Python Altair and Generative AI (MEAP v2)