02. Métricas de Avaliação
Classificação
Para modelos de classificação, como o KNN, as principais métricas são:
Métrica | Propósito | Fórmula | Caso de Uso |
---|---|---|---|
Acurácia | Proporção de previsões corretas em todas as classes | \(\frac{TP + TN}{TP + TN + FP + FN}\) | Útil para conjuntos balanceados |
Precisão | Proporção de positivos previstos que são realmente corretos | \(\frac{TP}{TP + FP}\) | Importante quando falsos positivos são custosos |
Recall | Proporção de positivos reais corretamente identificados | \(\frac{TP}{TP + FN}\) | Importante quando falsos negativos são custosos |
F1-Score | Média harmônica entre precisão e recall | \(2 \cdot \frac{Precisão \cdot Recall}{Precisão + Recall}\) | Útil para dados desbalanceados |
Matriz de Confusão | Resumo tabular dos resultados de previsão (TP, TN, FP, FN) | - | Detalha desempenho por classe |
Regressão
Para modelos de regressão, as métricas mais comuns são:
Métrica | Propósito | Fórmula | Caso de Uso |
---|---|---|---|
MAE | Média das diferenças absolutas entre predições e valores reais | $\frac{1}{N} \sum_{i=1}^N | y_i - \hat{y}_i |
MSE | Média das diferenças quadráticas entre predições e valores reais | \(\frac{1}{N} \sum_{i=1}^N (y_i - \hat{y}_i)^2\) | Sensível a outliers, comum em redes neurais |
RMSE | Raiz quadrada do MSE, erro na mesma unidade do alvo | \(\sqrt{\frac{1}{N} \sum_{i=1}^N (y_i - \hat{y}_i)^2}\) | Preferido para magnitude de erro interpretável |
MAPE | Média percentual do erro relativo aos valores reais | $\frac{1}{N} \sum_{i=1}^N \left | \frac{y_i - \hat{y}_i}{y_i}\right |
\(R^2\) | Proporção da variância explicada pelo modelo | \(1 - \frac{\sum_{i=1}^N (y_i - \hat{y}_i)^2}{\sum_{i=1}^N (y_i - \bar{y})^2}\) | Indica ajuste do modelo, valores próximos de 1 são melhores |
Agrupamento
Para modelos de agrupamento, como o K-Means, utiliza-se:
Métrica | Propósito | Interpretação |
---|---|---|
Silhouette Score | Mede o quão bem cada ponto está agrupado | Valores próximos de 1 indicam bom agrupamento |
Essas métricas permitem comparar modelos, identificar pontos de melhoria e justificar escolhas para cada problema.