Skip to content

5. Correlação entre Variáveis

A análise de correlação é fundamental para entender como as variáveis numéricas se relacionam entre si. Correlações altas indicam que as variáveis carregam informações semelhantes, enquanto correlações baixas sugerem que cada variável pode contribuir de forma única para o agrupamento.

O heatmap facilita a visualização dessas relações, destacando pares de variáveis que se movem juntos ou de forma oposta. No contexto do K-means, entender as correlações ajuda a evitar redundância de informações e pode orientar a escolha de variáveis ou a necessidade de técnicas de redução de dimensionalidade.

plt.figure(figsize=(6,5))
corr = df[['math score', 'reading score', 'writing score']].corr()
sns.heatmap(corr, annot=True, cmap='coolwarm', vmin=-1, vmax=1)
plt.title('Heatmap de Correlação das Notas')
plt.savefig('imagens/heatmap_correlation.png')
plt.show()
plt.tight_layout()
plt.close()