Skip to content

8. Divisão dos Dados em Treino e Teste

O conjunto de treino possui 80% dos exemplos e o de teste 20%, garantindo avaliação justa do modelo.

from sklearn.model_selection import train_test_split

# Divisão dos dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)
print('Formato treino:', X_train.shape, y_train.shape)
print('Formato teste:', X_test.shape, y_test.shape)

Formato treino: (800, X) (800,) Formato teste: (200, X) (200,)

A divisão garante avaliação justa e evita overfitting. Segue boas práticas de machine learning.