课程概况
Quer aprender a melhorar a precisão dos seus modelos de aprendizado de máquina? Que tal descobrir quais colunas de dados criam os atributos mais úteis? Damos as boas-vindas ao curso Feature Engineering no Google Cloud Platform. Falaremos sobre a diferença entre atributos bons e ruins, além de como pré-processar e transformar essas variáveis para o uso ideal nos seus modelos de aprendizado de máquina.
Nesse curso, você fará laboratórios interativos para ver na prática como escolher atributos e fazer o pré-processamento no Google Cloud Platform. Nossos instrutores apresentarão as soluções de código em detalhes, que também serão disponibilizadas para usar como referência nos seus próprios projetos de aprendizado de máquina.
课程大纲
Introdução
Quer aprender a melhorar a precisão dos seus modelos de aprendizado de máquina? Que tal descobrir quais colunas de dados criam os atributos mais úteis? Damos as boas vindas ao curso Feature Engineering no Google Cloud Platform. Falaremos sobre a diferença entre atributos bons e ruins, além de como pré-processar e transformar essas variáveis para o uso ideal nos seus modelos.
De dados brutos a atributos
A engenharia de atributos é geralmente a fase mais longa e difícil da criação de projetos de aprendizado de máquina. No processo de engenharia de atributos, você começa com dados brutos e usa seu conhecimento específico para criar os atributos que farão seus algoritmos de aprendizado de máquina funcionar. Neste módulo, veremos como criar um bom atributo e como representá-lo no seu modelo.
Pré-processamento e criação de atributos
Esta seção do módulo aborda o pré-processamento e a criação de atributos. Essas são técnicas de processamento de dados que podem ajudar você a preparar um conjunto de atributos para um sistema de aprendizado de máquina.
Cruzamento de atributos
No aprendizado de máquina tradicional, o cruzamento de atributos não tem uma função. No entanto, em métodos modernos, esse recurso é um item indispensável do seu kit de ferramentas. Neste módulo, você aprenderá como saber em que tipos de problemas o cruzamento de atributos pode ajudar o aprendizado de máquina.
TF Transform
O TensorFlow Transform (tf.Transform) é uma biblioteca de dados de pré-processamento no TensorFlow. Ele pode ser usado para casos de pré-processamento que necessitem de uma transmissão total de dados, como: - normalização de valores de entrada por média e stdev; - integralização de vocabulário a partir da análise de todos os exemplos de entrada dos valores; - criação de intervalos para entradas com base na distribuição de dados observada. Neste módulo, conheceremos os casos de uso do tf.Transform.
Resumo
Neste módulo, faremos uma recapitulação dos principais pontos aprendidos em cada módulo do curso Feature Engineering: como selecionar bons atributos, como realizar pré-processamento em grande escala, como usar cruzamentos de atributos e treinamento prático com o TensorFlow.