컴공생의 다이어리
[파이썬, python] matplotlib - 꺽은 선(plot), 히스토그램(hist), 상자 그림(boxplot) 본문
데이터 분석 & 머신러닝
[파이썬, python] matplotlib - 꺽은 선(plot), 히스토그램(hist), 상자 그림(boxplot)
컴공 K 2021. 3. 20. 00:01matplotlib 라이브러리란?
파이썬에서 데이터 시각화를 할 때, matplotlib이라는 라이브러리를 가장 많이 사용한다. matplotlib 라이브러리는 파이썬에서 2D형태의 그래프, 이미지 등을 그릴 때 사용하는 것으로, 실제 과학 컴퓨팅 연구 분야나 인공지능 연구 분야에서도 많이 활용된다. matplotlib에 관해서만 책 한 권 이상의 분량이 나올 정도로 내용이 방대하다.
꺽은 선(plot)
아래 코드는 [10,20,30,40,50]이라는 값만을 가지고 plot을 그린 것이다. 이 값들이 x축을 가리킬지, y축을 가리킬지 모르겠다면 출력 결과를 통해 알 수 있다. [10,20,30,40,50]은 바로 y축 값들이다. x축의 값들을 생략할 경우 x축은 range(y축 데이터 개수)로 표현된다.
import matplotlib.pyplot as plt #라이브러리 불러오기
plt.plot([10,20,30,40,50]) #plot() 함수에 데이터 입력
plt.show() #그래프 보여주기
이번에는 plot()함수에 두 개의 리스트가 콤마(,)로 구분되어 입력된 것이다. 두 개의 리스트 중 첫번째 리스트인 [1,2,3,4,5]가 x축 값이고, 두번째 리스트인 [10,30,15,20,40]가 y축 값으로 입력된다.
import matplotlib.pyplot as plt
plt.plot([1,2,3,4,5],[10,30,15,20,40])
plt.show()
히스토그램(hist)
히스토그램은 자료의 분포 상태를 직사각형 모양의 막대 그래프로 나타낸 것으로, 데이터의 빈도에 따라 높이가 결정된다. 아래코드는 data라는 리스트의 히스토그램으로 나타낸 것이다.
import matplotlib.pyplot as plt
plt.rc("font", family='NanumGothic')
plt.title("히스토그램")
data=[1,1,2,3,3,3,4,4,4,5,6,7,8,8]
plt.hist(data)
상자 그림(boxplot)
상자 그림은 가공하지 않은 자료를 그대로 이용하는 것이 아니라, 자료에서 얻어낸 최댓값, 최솟값, 상위 1/4, 2/4(중앙값), 3/4에 위치한 값을 보여주는 그래프이다.
import matplotlib.pyplot as plt
import random
plt.rc("font", family='NanumGothic')
result=[]
for i in range(50):
result.append(random.randint(1,1000))
#print(sorted(result))
plt.title('상자 그림(boxplot)')
plt.boxplot(result)
plt.show()
그래프 옵션
그래프 옵션은 아래 게시물에 정리되어 있다.
728x90
'데이터 분석 & 머신러닝' 카테고리의 다른 글
[파이썬, python] matplotlib - 산점도(scatter), 버블(bubble) (0) | 2021.03.21 |
---|---|
[파이썬, python] matplotlib - 막대그래프(bar, barh), 원그래프(pie) (0) | 2021.03.20 |
[파이썬, python] matplotlib 그래프 옵션 - 제목(title), 범례(legend), 색상(color), 선 모양(linestyle), 마커 모양(marker) (0) | 2021.03.19 |
[판다스, pandas] 행 열 전환(transpose) (0) | 2021.03.19 |
[판다스, pandas] 생략된 열을 모든 열(column)이 표시되도록 설정 (0) | 2021.03.19 |
Comments