Pclass와 Survived feature 사이 관계 파악
f, ax = plt.subplots(1, 2, figsize = (20, 5))
##도화지 준비 - 1행 2열의 도화지 준비
df_train['Survived'].value_counts().plot.pie(explode=[0, 0.1], autopct='%1.1f%%', ax=ax[0], shadow = True)
ax[0].set_title('Pie plot - Survived')
ax[0].set_ylabel('')
sns.countplot(x = 'Survived', data=df_train, ax=ax[1])
ax[1].set_title('Count plot - Survived')
plt.show()
value_counts() : 개수
explode : 분리해줌
Count vs Sum
count : 각 Pclass의 개수
sum : Survived는 0과 1의 값으로 표현되는데, 여기서 그 값들을 각각 합한 것
as_index 값을 True로 설정한 경우
as_index 값을 False로 설정한 경우
이렇게 그래프가 두 개로 나뉘어져서 그려지기에 True로 설정해야 함.
'캐글' 카테고리의 다른 글
titanic 1. dataset check (Youhan Lee) (0) | 2024.06.14 |
---|