Skip to content

08. Pré-processamento

São realizadas etapas de limpeza dos dados, tratamento de valores ausentes e normalização das variáveis numéricas, preparando o dataset para o treinamento do modelo.


Código utilizado:

for col in ["math score", "reading score", "writing score"]:
    df[col] = df[col].fillna(df[col].mean())
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
df[["math score", "reading score", "writing score"]] = scaler.fit_transform(df[["math score", "reading score", "writing score"]])
df.head()


Complemento: Arquivo valores_ausentes.csv mostra que não há valores ausentes nas colunas de notas. Arquivo dados_normalizados.csv mostra as notas normalizadas entre 0 e 1. O pré-processamento garante que o modelo não seja afetado por valores faltantes e que as variáveis estejam na mesma escala.