课程概况
この 1 週間の速習コースは、Data Engineering on Google Cloud Platform 専門講座の以前のコースを基にして作成されています。動画講義、デモ、ハンズオンラボを通して、Google Cloud Platform で Hadoop、Spark、Pig、Hive の各ジョブを実行するためのコンピューティング クラスタを作成、管理する方法を学びます。また、コンピューティング クラスタからクラウド ストレージのさまざまなオプションにアクセスして、Google の機械学習機能を分析プログラムに統合する方法についても学習します。
ハンズオンラボでは、ウェブ コンソールと CLI を使って Dataproc クラスタを作成、管理し、クラスタを使用して Spark と Pig のジョブを実行します。次に、BigQuery およびストレージと統合する iPython ノートブックを作成し、Spark を活用します。最後に、機械学習 API をデータ分析に統合します。
要件
• Google Cloud Platform Big Data & Machine Learning Fundamentals を修了していること(または同等の経験があること)
• Python に関する知識があること
课程大纲
モジュール 1: Cloud Dataproc の概要
モジュール 2: Dataproc ジョブの実行
モジュール 3: GCP の活用
モジュール 4: 非構造化データの分析