Seaborn
- matplotlib을 기반으로 더 다양한 시각화 방법을 제공하는 라이브러리
- 커널밀도그림
- 카운트그림
- 캣그림
- 스트립그림
- 히트맵
- Seaborn import 하기
import seaborn as sns
- 커널밀도그림(Kernel Density Plot)
- 히스토그램과 같은 연속적인 분포를 곡선화해서 그린 그림
# in Histogram
x = np.arange(0, 22, 2)
y = np.random.randint(0, 20, 20)
plt.hist(y, bins=x)
plt.show()
# kdeplot
sns.kdeplot(y, shade=True)
plt.show()
- 카운트그림(Count Plot)
- 범주형 column의 빈도수를 시각화 -> Groupby 후의 도수를 비교하는 것과 동일
vote_df = pd.DataFrame({"name": ['Andy', 'Bob', 'Cat'], "vote": [True, True, False]})
vote_df
# in matplotlib barplot
vote_count = vote_df.groupby('vote').count()
vote_count
plt.bar(x=[False, True], height=vote_count['name'])
plt.show()
# sns의 countplot
sns.countplot(x=vote_df['vote'])
plt.show()
- 캣그림(Cat Plot)
- 숫자형 변수와 하나 이상의 범주형 변수의 관계를 보여주는 함수
import os
path = '/content/drive/MyDrive/data/covid/'
covid = pd.read_csv(os.path.join(path,'country_wise_latest.csv'))
covid.head()
s = sns.catplot(x='WHO Region', y='Confirmed', data=covid)
s.fig.set_size_inches(10, 6)
plt.show()
- hue, kind 옵션으로 범주별 색깔을 구분할 수 있고, 다른 종류의 플랏으로 표현 할 수 있다.
- 스트립그림(Strip Plot)
- scatter plot과 유사하게 데이터의 수치를 표현하는 그래프
sns.stripplot(x='WHO Region', y='Recovered', data=covid)
plt.show()
- swarmplot
sns.swarmplot(x='WHO Region', y='Recovered', data=covid)
plt.show()
- 히트맵(Heatmap)
- 데이터의 행렬을 색상으로 표현해주는 그래프
covid.corr()
sns.heatmap(covid.corr())
plt.show()
'프로그래머스 AI 데브코스 5기 > Data study' 카테고리의 다른 글
탐색적 데이터 분석 - EDA (0) | 2023.04.05 |
---|---|
Matplotlib의 여러 plot들 (0) | 2023.03.30 |
Matplotlib으로 데이터 시각화 하기 (0) | 2023.03.30 |
Pandas 시작하기 (0) | 2023.03.29 |
Linear Algebra with Numpy (0) | 2023.03.27 |