Sobre
Turmas
Projetos
Time
Materiais
Artigos
Aulas
PT
EN
Materiais
Materiais
· Dados
6. Ciência de Dados
28 min de leitura
→
Anterior
5. Análise de Dados
Nesta página
6.1. Introdução a Machine Learning
Objetivos de Aprendizagem
Roteiro de Assuntos
Conceitos Fundamentais de Machine Learning
Definição geral
Relação entre estatística, computação e dados
Principais aplicações
Taxonomias e Categorias de Machine Learning
Aprendizado supervisionado
Aprendizado não supervisionado
Aprendizado por reforço
Deep Learning
Pipeline Geral de Machine Learning
Definição do problema e objetivo preditivo
Coleta e estruturação dos dados
Limpeza e pré-processamento
3.3.1 Tratamento de dados faltantes
3.3.2 Normalização e padronização
3.3.3 Codificação de variáveis categóricas
Seleção de modelos
Treinamento e validação
Aprendizado Supervisionado
Definição formal
Estrutura matemática
Espaço de entradas e saídas
Funções de perda
Regressão linear (o “caso base” da regressão)
Como a regressão linear “aprende” (loss e otimização)
Como interpretar os pesos $w$ (o que o modelo “descobriu”)
O que pode dar errado (e como isso se manifesta)
Classificação (prever classe, não número)
Tipos de problemas supervisionados — **Essencial**
Outros Modelos supervisionados clássicos
Regressão logística
Árvores de decisão
Random Forest
Gradient Boosting (XGBoost, LightGBM, CatBoost)
Support Vector Machines
Redes neurais artificiais
Critérios de avaliação
Classificação: acurácia, precisão, recall, F1, ROC-AUC
Regressão: RMSE, MAE, R²
Problemas e riscos específicos
Overfitting
Underfitting
Estratégias de mitigação
4.7.1 Validação cruzada
Aumento de dados (data augmentation)
Seleção de features
Referências