1. Importação das Bibliotecas

Utilizaremos as seguintes bibliotecas: - pandas: manipulação e análise de dados tabulares, facilitando a leitura, filtragem e transformação dos dados. - numpy: operações matemáticas e manipulação eficiente de arrays numéricos, base para cálculos de alta performance. - matplotlib: criação de gráficos estáticos para visualização dos dados e dos resultados dos clusters. - seaborn: gráficos estatísticos avançados e integração com pandas para visualizações mais sofisticadas. - scikit-learn: ferramentas essenciais para machine learning, incluindo: - KMeans para realizar o agrupamento; - silhouette_score e adjusted_rand_score para avaliar a qualidade dos clusters; - StandardScaler e LabelEncoder para pré-processamento dos dados.

Importar e configurar essas bibliotecas no início do projeto garante um ambiente robusto para análise, visualização e modelagem. O uso de aliases (pd, np, plt, sns) torna o código mais limpo e padronizado.

Código

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score, adjusted_rand_score
from sklearn.preprocessing import StandardScaler, LabelEncoder