你将学到什么
分析と機械学習のための大規模なビッグデータの処理
新しい機械学習モデルの構築の基礎
ストリーミングデータ パイプラインとダッシュボードの作成
课程概况
この 2 週間の速習オンデマンド コースでは、Google Cloud Platform(GCP)のビッグデータ機能と機械学習機能を紹介します。Google Cloud Platform の概要を簡単に説明した後、データ処理機能について詳しく説明します。
このコースを修了すると、受講者は次のことができるようになります。
• Google Cloud Platform のビッグデータと機械学習に関係する主要プロダクトの目的と価値を理解する
• Cloud SQL と Cloud Dataproc を使用して既存の MySQL と Hadoop、Pig、Spark、Hive のワークロードを Google Cloud Platform に移行する
• BigQuery と Cloud Datalab を使用してインタラクティブなデータ解析を実行する
• Cloud SQL、Bigtable、Datastore のいずれかを選択する
• TensorFlow を使用してニューラル ネットワークをトレーニングし、利用する
• Google Cloud Platform のさまざまなデータ処理プロダクトについて理解し、選択する
このコースは、次の 1 つ以上の分野で 1 年程度の経験がある方を対象としています。
• SQL などの一般的なクエリ言語
• 抽出、変換、読み込みの操作
• データ モデリング
• 機械学習または統計
• Python でのプログラミング
Google アカウントに関する注意点:
• 現在 Google サービスは中国では使用できません。
课程大纲
Data and Machine Learning on GCP 専門講座の概要
Big Data and Machine Learning fundamentals on GCP コースへようこそ。ここでは、このコースの基本的な構成と、このコースで取り上げるビッグデータの 4 つの主な課題について学びます。
Cloud SQL と Spark を使用した商品のレコメンデーション
このモジュールでは、オンプレミスで実行されている Apache Spark ML の既存のレコメンデーション モデルを使用して、レコメンデーション モデルの概要と、Cloud Dataproc および Cloud SQL を使用してクラウドでこのモデルを実行する方法について学びます。
BigQuery ML で訪問者の購入を予測する
このモジュールでは、BigQuery と大規模なビッグデータ分析の基礎について学びます。さらに、BigQuery ML で SQL のみを使用して、訪問者の購入を予測するカスタムの機械学習モデルを構築する方法を学びます。
Cloud Pub/Sub と Cloud Dataflow を使用してストリーミング データ パイプラインを作成する
このモジュールでは、自動スケーリングに対応したストリーミング データ パイプラインを設計、構築して、データの取り込み、処理、ダッシュボードでの可視化を行います。パイプラインを構築する前に、メッセージ指向アーキテクチャの基礎と、最新のデータ パイプラインを設計、実装する際の注意点について学びます。
Vision API と Cloud AutoML を使用して、構築済みのモデルで画像を分類する
カスタム ML モデルをゼロから作成したくない場合もあります。ここでは、Vision API や Cloud AutoML のような構築済みの ML モデルを活用、拡張して画像を分類する方法を学びます。
まとめ
最後のモジュールでは、この基礎コースで説明した主な課題、ソリューション、トピックについて確認します。また、その他のリソースと、Google Cloud Data Engineer の認定資格を取得するためのステップについても確認します。