课程概况
Vous souhaitez découvrir comment améliorer la précision de vos modèles de machine learning (ML) ? Vous voulez identifier les colonnes de données offrant les caractéristiques les plus utiles ? Bienvenue dans le cours Feature Engineering on Google Cloud Platform (Extraction de caractéristiques sur Google Cloud Platform). Nous vous expliquerons ce qui distingue les bonnes caractéristiques des mauvaises, puis nous vous montrerons comment prétraiter et transformer vos caractéristiques afin d’optimiser leur efficacité dans vos modèles.
Des ateliers interactifs vous permettront de mettre en pratique ce que vous avez appris. Vous sélectionnerez vous-même des caractéristiques, puis les prétraiterez dans Google Cloud Platform. Nos formateurs vous aideront à comprendre les solutions de code. Ces solutions seront accessibles à tous, et pourront vous servir de référence en cas de besoin lorsque vous travaillerez sur vos propres projets de ML.
课程大纲
Introduction
Vous souhaitez découvrir comment améliorer la précision de vos modèles de machine learning ? Vous voulez identifier les colonnes de données offrant les caractéristiques les plus utiles ? Bienvenue dans le cours Feature Engineering (Extraction de caractéristiques). Tout d'abord, nous vous expliquerons comment distinguer les bonnes caractéristiques des mauvaises. Ensuite, nous vous montrerons comment prétraiter et transformer ces caractéristiques afin d'optimiser leur efficacité dans vos modèles.
Des données brutes aux caractéristiques
L'extraction de caractéristiques est souvent la phase la plus longue et la plus complexe du développement de votre projet de machine learning. Lors du processus d'extraction de caractéristiques, vous partez des données brutes, puis utilisez vos propres connaissances du domaine afin de créer les caractéristiques appropriées pour vos algorithmes de machine learning. Dans ce module, nous allons étudier ce qui distingue les bonnes caractéristiques des mauvaises, et la façon de les représenter dans votre modèle de machine learning.
Prétraitement et création des caractéristiques
Cette section porte sur le prétraitement et la création de caractéristiques. Ces techniques de traitement des données vous aideront à préparer un ensemble de caractéristiques pour un système de machine learning.
Croisement de caractéristiques
Le croisement de caractéristiques ne joue pas un rôle significatif dans le machine learning traditionnel. À l'inverse, sa valeur est inestimable pour les méthodes de machine learning actuelles. Dans ce module, vous allez apprendre à reconnaître les types de problèmes pour lesquels le croisement de caractéristiques joue un rôle majeur en termes d'apprentissage.
TF Transform
TensorFlow Transform (tf.Transform) est une bibliothèque conçue pour le prétraitement des données avec TensorFlow. Elle est utile pour les prétraitements qui nécessitent un croisement complet des données, tels que la normalisation d'une valeur d'entrée selon la moyenne et l'écart-type, la conversion du vocabulaire en nombres entiers à partir des exemples d'entrées pour toutes les valeurs, la création de buckets d'entrées à partir de la répartition observée des données. Dans ce module, nous étudierons les cas d'utilisation de tf.Transform.
Résumé
Voici le résumé des principaux points appris dans chaque module du cours Feature Engineering (Extraction des caractéristiques) : sélection des bonnes caractéristiques, prétraitement à grande échelle, utilisation des croisements de caractéristiques, entraînement avec TensorFlow.