Introdução
Este relatório segue as etapas do projeto de árvore de decisão, mas agora utilizando o algoritmo KNN para classificação do desempenho dos estudantes.
Objetivo: - Explorar, analisar e preparar os dados para classificação. - Explicar cada etapa, resultados e limitações do conjunto de dados.
O KNN (K-Nearest Neighbors) é amplamente utilizado em problemas de classificação devido à sua simplicidade e capacidade de adaptação a diferentes tipos de dados. No contexto educacional, o KNN pode ser aplicado para prever o desempenho de estudantes, identificar padrões de aprovação/reprovação e apoiar decisões pedagógicas baseadas em similaridade de perfis.
Entre as vantagens do KNN estão a facilidade de implementação, a ausência de suposições sobre a distribuição dos dados e a interpretabilidade dos resultados. Por outro lado, o método pode ser sensível à escolha de K, à escala das variáveis e à presença de outliers, exigindo atenção especial ao pré-processamento.
Ao longo deste relatório, cada etapa será detalhada para garantir compreensão do processo, das decisões tomadas e das limitações inerentes ao método e ao conjunto de dados utilizado.
O KNN é um algoritmo simples, não-paramétrico e eficaz para problemas de classificação, especialmente quando interpretabilidade é importante.