1. Importação das Bibliotecas
Utilizaremos as seguintes bibliotecas: - pandas: manipulação e análise de dados tabulares, facilitando a leitura, filtragem e transformação dos dados. - numpy: operações matemáticas e manipulação eficiente de arrays numéricos, base para cálculos de alta performance. - matplotlib: criação de gráficos estáticos para visualização dos dados e dos resultados dos clusters. - seaborn: gráficos estatísticos avançados e integração com pandas para visualizações mais sofisticadas. - scikit-learn: ferramentas essenciais para machine learning, incluindo: - KMeans para realizar o agrupamento; - silhouette_score e adjusted_rand_score para avaliar a qualidade dos clusters; - StandardScaler e LabelEncoder para pré-processamento dos dados.
Importar e configurar essas bibliotecas no início do projeto garante um ambiente robusto para análise, visualização e modelagem. O uso de aliases (pd, np, plt, sns) torna o código mais limpo e padronizado.