O que é MLOps
MLOps = Machine Learning + DevOps
Ou seja:
- Você não só cria modelos…
- Você treina, versiona, testa, implanta, monitora e melhora continuamente
Problema que resolve:
Modelos que funcionam no notebook mas quebram em produção.
Onde o Azure entra
O Azure fornece o “ecossistema completo” pra isso, principalmente com:
- Azure Machine Learning (AML) → coração do MLOps
- Azure DevOps / GitHub → CI/CD
- Azure Data Lake / Blob Storage → dados
- Azure Kubernetes Service (AKS) → deploy escalável
- Azure Monitor → observabilidade
Pipeline completo de MLOps no Azure
1. Ingestão de dados
- Dados vêm de APIs, bancos, arquivos
- Armazenados em Data Lake / Blob
2. Preparação / Feature Engineering
- Limpeza
- Transformações
- Criação de features
3. Treinamento do modelo
- Experimentos versionados no Azure ML
- Registro de métricas (accuracy, loss, etc.)
4. Registro do modelo
-
Versionamento tipo:
- v1 → baseline
- v2 → melhorado
- Guardado no Model Registry
5. Deploy
- Como API (REST endpoint)
-
Em:
- AKS (produção)
- Containers
6. Monitoramento
- Drift de dados
- Performance
- Logs
7. Re-treinamento automático
- Quando modelo degrada → pipeline roda novamente
Principais funcionalidades na prática
Versionamento de tudo
- Código
- Dados
- Modelos
👉 Isso é CRÍTICO (evita caos)
Pipelines automatizados
- Treinar modelo automaticamente
- Testar
- Deploy automático se passar critérios
Reprodutibilidade
- Rodar o mesmo experimento amanhã e obter o mesmo resultado
Escalabilidade
- Treinar com GPU
- Servir milhares de requisições via AKS
Monitoramento inteligente
-
Detecta quando:
- Dados mudaram
- Modelo ficou ruim
Casos de uso reais
📊 1. Previsão de demanda (varejo)
- Modelo prevê vendas
- Atualiza diariamente
- Deploy automático
💳 2. Detecção de fraude
- Modelo roda em tempo real
- Monitora comportamento
- Re-treina com novos padrões
🚚 3. Logística
- Otimização de rotas
- Previsão de consumo
- Detecção de anomalias em dados industriais
Stack mínima recomendada
- Azure Machine Learning
- GitHub Actions ou Azure DevOps
- Python (scikit-learn ou PyTorch)
- Docker
- AKS (ou Azure Container Instances pra simplificar)
Erros comuns (evite isso)
- Treinar modelo manualmente (sem pipeline)
- Não versionar dados
- Deploy manual
- Ignorar monitoramento
Resultado: modelo vira “caixa preta quebrada”
Machine Learning Essentials
https://youtu.be/OPLt-eeyGkU?si=Qenojla7C1P6juew
Azure Machine Learning Studio options
Comments