Kurs
Data Warehousing on AWS – Intensive Training («AWSA05»)
Erfahren Sie, wie Sie mit Amazon Redshift eine Cloud-basierte Data-Warehousing-Lösung entwickeln.
Dauer
3 Tage
Preis
2'700.–
zzgl. MWST
Relevante Job-Rollen:
Data Analytics
Kurs-Facts
- Evaluation der Beziehung zwischen Amazon Redshift und anderen Big-Data-Systemen
- Fallbeispiele für Arbeitslasten von Data Warehouses evaluieren und von Fallstudien behandeln, die die Implementierung der AWS Daten- und Analyseservices als Teil der Data Warehousing-Lösung demonstrieren
- Einen Amazon Redshift-Knotentyp in der für Ihre Datenbedürfnisse geeigneten Grösse auswählen
- Für Amazon Redshift geeignete Sicherheitsfunktionen verstehen, wie z.B. Verschlüsselung, IAM-Berechtigungen und Datenbankberechtigungen
- Einen Amazon Redshift-Cluster in Betrieb nehmen und Komponenten und Funktionen zur Implementierung eines Data Warehouses in der Cloud nutzen
- Weitere AWS- und Analyse-Services wie Amazon DynamoDB, Amazon EMR, Amazon Kinesis Firehose und Amazon S3 als Beitrag zur Data-Warehousing-Lösung verwenden
- Ansätze und Methoden zur Konzeptionierung von Data Warehouses evaluieren
- Datenquellen bestimmen und Anforderungen evaluieren, die sich auf das Data-Warehouse-Konzept auswirken
- Data Warehouse im Hinblick auf die effektive Nutzung von Komprimierung, Datenverteilung und Sortiermethoden entwerfen
- Daten laden und entladen sowie Aufgaben der Datenwartung durchführen
- Abfragen verfassen und Abfragepläne zur Optimierung der Abfrageleistung auswerten
- Die Datenbank zur Ressourcenzuweisung konfigurieren, etwa des Speichers für Abfrage-Queues, und die Kriterien definieren, um Ihren konfigurierten Abfrage-Queues für eine bessere Verarbeitung bestimmte Abfragetypen zuzuweisen
- Ereignisbenachrichtigungen über Aktivitäten im Data Warehouse mithilfe von Funktionen und Services, wie Amazon Redshift Database Audit Logging, Amazon CloudTrail, Amazon CloudWatch und Amazon Simple Notification Service (Amazon SNS), überprüfen, überwachen und empfangen
- Betriebsaufgaben vorbereiten, etwa Grössenänderung des Amazon Redshift-Clusters und Verwendung von Snapsots für das Backup und die Wiederherstellung von Clustern
- Eine BI-Anwendung zur Durchführung von Datenanalysen und Visualisierungsaufgaben anhand Ihrer Daten verwenden
Dieser Kurs führt Sie ein in die Konzepte, Strategien und bewährten Methoden für die Konzeptionierung einer Cloud-basierten Data Warehousing-Lösung mit Amazon Redshift, dem Data Warehouse in AWS in Petabyte-Grösse. Es wird demonstriert, wie Daten für das Data Warehouse mithilfe anderer AWS-Services wie Amazon DynamoDB, Amazon EMR, Amazon Kinesis Firehose und Amazon Simple Storage Service (Amazon S3) gesammelt, gespeichert und vorbereitet werden. Wir werden ausserdem erläutern, wie Sie Business-Intelligence-(BI)-Tools zur Analyse Ihrer Daten einsetzen können.
Modul 1: Einführung in Data Warehousing
- Relationale Datenbanken
- Data-Warehousing-Konzepte
- Die Überschneidung von Data Warehousing und Big Data
- Überblick über die Datenverwaltung in AWS
- Praktisches Lab 1: Einführung in Amazon Redshift
- Konzeptueller Überblick
- Anwendungsfälle aus der Praxis
- Interaktive Demo 1: Rundgang durch die Amazon-Redshift-Konsole
- Praktischs Lab 2: Starten eines Amazon-Redshift-Clusters
- RA3 Nodes and AQUA-Architektur
- Amazon Redshift ML
- Aufbau des Clusters
- Verbinden mit dem Cluster
- Kontrolle des Zugriffs
- Sicherheit der Datenbank
- Daten laden
- Praktisches Lab 3: Optimieren von Datenbank-Schemata
- Optionales Lab: Starten eines Amazon-Redshift-Clusters
- Schemas und Datentypen
- Spaltenweise Komprimierung
- Stile der Datenverteilung
- Methoden zur Datensortierung
- Praktisches Lab 3: Optimieren von Datenbank-Schemas
- Überblick über Datenquellen
- Amazon S3
- Amazon DynamoDB
- Amazon EMR
- Amazon Kinesis Daten-Firehose
- AWS-Lambda-Datenbanklader für Amazon Redshift
- Redshift Data API
- SUPER Data Type
- Interaktive Demo 2: Verbinden Ihres Amazon-Redshift-Clusters mit einem Jupyter-Notebook mit Data API
- Interaktive Demo 3: Analyse halbstrukturierter Daten mit dem Datentyp SUPER
- Praktisches Lab 4: Laden von Echtzeitdaten in eine Amazon-Redshift-Datenbank
- Vorbereiten von Daten
- Data Warehousing auf AWS
- Laden von Daten mit COPY
- Pflegen von Tabellen
- Gleichzeitige Schreibvorgänge
- Fehlersuche bei Ladeproblemen
- Praktische Übung 5: Laden von Daten mit dem COPY-Befehl
- Amazon Redshift SQL
- Benutzerdefinierte Funktionen (UDFs)
- Faktoren, die die Abfrageleistung beeinflussen
- Der EXPLAIN-Befehl und Abfragepläne
- Arbeitslast-Verwaltung (WLM)
- Interaktive Demo 4: Applying mixed workload management on Amazon Redshift
- Praktisches Lab 6: Konfigurieren der Arbeitslastverwaltung
- Amazon Redshift Spectrum
- Konfigurieren von Daten für Amazon Redshift Spectrum
- Amazon-Redshift-Spectrum-Abfragen
- Daten-Transformation
- Daten-Sharing
- Übungs-Lab 2: Datenanalyse mit Amazon Redshift Spectrum
- Übungs-Lab 3: Daten-transformation und -Abfrage in Amazon Redshift
- Praktisches Lab 7: Verwendung von Amazon Redshift Spectrum
- Audit-Protokollierung
- Leistungsüberwachung
- Ereignisse und Benachrichtigungen
- Praktische Übungen 8: Auditing und Überwachung von Clustern
- Grössenänderung von Clustern
- Sichern und Wiederherstellen von Clustern
- Ressourcenkennzeichnung und Grenzen und Beschränkungen
- Praktisches Lab 9: Sichern, Wiederherstellen und Grössenänderung von Clustern
- Optional: Daten-Analyse und -Visualisierung
- Leistung von Visualisierungen
- Erstellen von Dashboards
- Amazon-QuickSight-Editionen und -Funktionen
- Data Analytics
- Vertrautheit mit relationalen Datenbanken und Datenbankdesign-Konzepten