7. Pré-processamento dos Dados
Nesta etapa, realizamos a codificação das variáveis categóricas e a normalização das variáveis numéricas para preparar os dados para o K-means.
# Codificação das variáveis categóricas
df_encoded = df.copy()
categorical_cols = df_encoded.select_dtypes(include=['object']).columns
for col in categorical_cols:
df_encoded[col] = LabelEncoder().fit_transform(df_encoded[col])
# Normalização das variáveis numéricas
scaler = StandardScaler()
features = ['math score', 'reading score', 'writing score']
df_encoded[features] = scaler.fit_transform(df_encoded[features])
df_encoded.head()