7. Filtrar e Agrupar Dados por Gênero ou Grupo Étnico
A comparação entre grupos é uma etapa importante para identificar possíveis desigualdades, padrões de desempenho e oportunidades de intervenção. Ao analisar médias por gênero ou grupo étnico (mesmo que fictício), é possível observar tendências que podem refletir fatores sociais, pedagógicos ou estruturais.
É fundamental, porém, interpretar esses resultados com cautela e responsabilidade, especialmente quando os rótulos não correspondem a etnias reais. O objetivo é promover uma análise crítica e evitar conclusões precipitadas ou interpretações enviesadas.
Nota: Os grupos étnicos são apenas rótulos fictícios e não representam etnias reais.
# Médias das notas por gênero
gender_group = df.groupby('gender')[['math score', 'reading score', 'writing score']].mean()
print('Médias das notas por gênero:')
print(gender_group)
# Médias das notas por grupo étnico
ethnic_group = df.groupby('race/ethnicity')[['math score', 'reading score', 'writing score']].mean()
print('\nMédias das notas por grupo étnico:')
print(ethnic_group)
# Visualização
plt.figure(figsize=(10, 5))
gender_group.plot(kind='bar')
plt.title('Média das Notas por Gênero')
plt.ylabel('Nota Média')
plt.xticks(rotation=0)
plt.savefig('imagens/barplot_genero.png')
plt.show()
from IPython.display import Image, display
display(Image(filename='imagens/barplot_genero.png'))
plt.figure(figsize=(10, 5))
ethnic_group.plot(kind='bar')
plt.title('Média das Notas por Grupo Étnico')
plt.ylabel('Nota Média')
plt.xticks(rotation=0)
plt.savefig('imagens/barplot_etnia.png')
plt.show()
display(Image(filename='imagens/barplot_etnia.png'))
As médias por gênero mostram que estudantes do gênero feminino têm desempenho superior em leitura e escrita, enquanto o masculino tem média ligeiramente maior em matemática. As diferenças entre grupos étnicos (rótulos) também são visíveis, mas não podem ser interpretadas como diferenças reais entre etnias.
