Por que modelos muito simples erram... e modelos muito complexos também?
Quem já tentou ajustar um modelo a dados experimentais conhece o dilema:
1. Quando usa uma função muito simples, o modelo não representa bem os dados.
2. Quando usa uma função muito complexa, ele perde a capacidade de generalizar
o fenômeno, pois se ajusta demais aos dados.
Esse dilema é conhecido como bias-variance tradeoff, ou compromisso entre viés
e variância.
📉 Bias (viés): quando o modelo não apreende o
essencial
Viés refere-se ao uso de um modelo excessivamente simples para descrever
um conjunto de dados que vêm de um fenômeno mais complexo. A complexidade do
fenômeno é subestimada e o modelo ignora padrões importantes presentes nos
dados.
Viés é, portanto, uma medida da diferença entre a predição média do modelo e o
valor real que se quer prever.
Exemplo: Ajustar uma reta a um conjunto de pontos que claramente seguem uma
curva.
Consequência: o modelo erra sistematicamente, mesmo quando há muitos dados.
Dizemos que ele sofre de underfitting (ajuste insuficiente).
📈 Variância: quando o modelo exagera nos
detalhes
Se pequenas mudanças nos dados exigirem grandes mudanças no modelo,
dizemos que ele tem alta variância.
Variância é uma medida da sensibilidade do modelo aos dados de treinamento:
quanto o modelo muda quando os dados mudam.
Exemplo: Ajustar um polinômio de grau 10 a um pequeno conjunto de pontos. O
modelo passa por todos os pontos, mas faz curvas exageradas entre eles.
Consequência: o modelo vai bem nos dados conhecidos, mas fracassa quando
confrontado com dados novos. Dizemos que ele sofre de overfitting (ajuste
excessivo).
🎯 Encontrar o ponto ótimo
Todo modelo comete erros, que podem ser decompostos em três componentes:
1. Erro por viés → o modelo é inadequado porque é muito simples;
2. Erro por variância → o modelo varia demais com diferentes amostras;
3. Ruído irreversível → é a variabilidade natural dos dados, independente do
modelo.
O objetivo é encontrar um modelo que equilibre viés e variância, minimizando o
erro total. É preciso captar o essencial do fenômeno, sem exagerar. Esse é o
bias-variance tradeoff — uma situação em que melhorar um aspecto piora outro.
⚙️ Comparando
modelos
Modelo |
Viés |
Variância |
Baixo |
Médio |
|
Médio |
Baixo |
|
Polinômio
complexo |
Baixo |
Alto |
🌽 Exemplo: produção de milho em diferentes
níveis de fósforo
Suponha:
- Cinco níveis de fósforo: 20, 40, 60, 80, 100 kg/ha;
- Médias das dez repetições: 2,8 – 3,2 – 3,4 – 3,3 – 1,8 ton/ha.
O que fazer?
Depende do objetivo e da escolha do modelo:
🔹 Abordagem 1: ANOVA tradicional (modelo
categórico)
Vantagens:
- Simples, interpretável;
- Sem necessidade de assumir uma relação funcional entre os níveis.
Desvantagens:
- Não detecta tendência;
- Alta variância se os dados forem ruidosos;
- Sem poder de predição fora dos níveis observados.
🔹 Abordagem 2: Regressão linear (modelo
numérico)
Vantagens:
- Mais parcimonioso: apenas dois parâmetros;
- Permite interpolação e extrapolação.
Desvantagens:
- Alto viés se a relação não for linear;
- Ignora variações não lineares reais.
🔹 Abordagem 3: Polinômios (modelo mais flexível)
Vantagens:
- Captura efeitos não lineares;
- Pode representar melhor o comportamento real.
Desvantagens:
- Alta variância;
- Risco de overfitting — modelo ajustado demais aos dados disponíveis.
🔚 Encerramento
Entre a simplicidade que ignora o fenômeno e a complexidade que se perde
nos ruídos, há um ponto de equilíbrio. O desafio da modelagem está em
reconhecê-lo — com dados, bom senso e teoria.
No comments:
Post a Comment