1. Matplotlib Case Study
- 꺾은선 그래프(Plot)
x = np.arange(20) # 0~ 19
y = np.random.randint(0, 20, 20) # 0~20까지 난수 20번 생성
plt.xlabel('x value')
plt.ylabel('y value')
plt.axis([0, 21, 0, 21])
plt.yticks([i for i in range(0, 21, 5)])
plt.plot(x, y)
plt.show()
- 산점도(Scatter Plot)
x = np.arange(20) # 0~ 19
y = np.random.randint(0, 20, 20) # 0~20까지 난수 20번 생성
plt.xlabel('x value')
plt.ylabel('y value')
plt.axis([0, 21, 0, 21])
plt.yticks([i for i in range(0, 21, 5)])
plt.scatter(x, y)
plt.show()
📌 꺾은선 그래프 : 시계열 데이터
📌 별개의 데이터 사이 관계를 보고자 할 때
- 박스 플랏(Box Plot)
- 단일 변수의 분포를 전반적으로 보고 싶을 때 많이 사용한다.
- 수치형 데이터에 대한 정보를 담은 그림(Q1, Q2, Q3, min, max)
plt.title('Box plot of y')
plt.boxplot(y)a
plt.show()
- 두 변수의 box plot을 동시에 그릴수도 있다.
plt.title('Box plot of y')
plt.boxplot([x, y])
plt.show()
- 막대 그래프(Bar plot)
- 범주형 데이터에서 많이 사용된다.
- 데이터의 "값"과 그 값의 크기를 직사각형으로 나타낸 그림
plt.bar(x, y)
plt.xticks([i for i in range(0, 21)])
plt.show()
- cf) HIstogram
- 도수분포를 직사각형의 막대 형태로 나타냈다.
- "계급"으로 나타낸 것이 특징: 0, 1, 2가 아니라 0-2 까지 처럼 "범주형" 데이터로 구성 후 그림을 그림
- 도수분포를 직사각형의 막대 형태로 나타냈다.
plt.xticks([i for i in range(0, 21, 2)])
plt.hist(y, bins=np.arange(0,20,2))
plt.show()
- 원형 그래프(Pie Chart)
- 데이터에서 전체에 대한 부분의 비율을 부채꼴로 나타낸 그래프
- 다른 그래프에 비해서 비율 확인이 용이
z = [100, 300, 200, 400]
plt.pie(z, labels=['one', 'two', 'three', 'four'])
plt.legend()
plt.show()
'프로그래머스 AI 데브코스 5기 > Data study' 카테고리의 다른 글
탐색적 데이터 분석 - EDA (0) | 2023.04.05 |
---|---|
Seaborn (0) | 2023.03.30 |
Matplotlib으로 데이터 시각화 하기 (0) | 2023.03.30 |
Pandas 시작하기 (0) | 2023.03.29 |
Linear Algebra with Numpy (0) | 2023.03.27 |