课程概况
Dieser einwöchige Intensivkurs baut auf bisherigen Kursen der Spezialisierung Data Engineering on Google Cloud Platform auf. Mit Videovorträgen, Vorführungen und Labs zur praktischen Anwendung lernen Sie, wie Sie Computecluster erstellen und verwalten, um Hadoop-, Spark-, Pig- und/oder Hive-Jobs auf der Google Cloud Platform auszuführen.Außerdem wird erläutert, wie Sie auf verschiedene Cloudspeicherlösungen über deren Computecluster zugreifen und die Google-Funktionen für maschinelles Lernen in deren Analyseprogramme einbinden.
In den Labs zur praktischen Anwendung erstellen und verwalten Sie Dataproc-Cluster mit der Webkonsole und der Befehlszeile und führen über die Cluster Spark- und Pig-Jobs aus. Dann erstellen Sie iPython-Notebooks, die in BigQuery und Speicherplatz eingebunden werden können und nutzen Spark. Zuletzt binden Sie die APIs für maschinelles Lernen in die Datenanalyse ein.
Voraussetzungen
• Google Cloud Platform Big Data & Machine Learning Fundamentals (oder Ähnliches)
• Grundkenntnisse in Python
课程大纲
Modul 1: Einführung in Cloud Dataproc
Modul 2: Dataproc-Jobs ausführen
Modul 3: GCP nutzen
Modul 4: Unstrukturierte Daten analysieren