목록모두의 데이터분석 (3)
컴공생의 다이어리
산점도(scatter) 산점도는 scatter() 함수를 사용해 표현할 수 있다. 산점도는 x축과 y축에 해당하는 데이터의 상관관계를 표현할 때 사용하며 점이 흩어져 있는 그래프라는 의미이다. 두 개의 축을 기준으로 데이터가 얼마나 퍼져있는지(분포) 알 수 있어 '산포도'라고도 불린다. import matplotlib.pyplot as plt plt.rc("font", family='NanumGothic') plt.title('산점도') plt.scatter([1,2,3,4],[5,1,4,2]) plt.show() 버블 차트(bubble) 버블 차트는 scatter() 함수를 사용해 표현할 수 있다. scatter() 함수로 버블 차트를 나타내려면 기존 코드에서 size를 의미하는 s 속성을 추가하고 원..
막대그래프(bar, barh) bar() 함수는 수직 막대그래프를 표현하는 명령어이다. 막대그래프에서 막대의 길이는 각 데이터의 크기를 의미한다. 아래는 막대그래프의 예시 코드와 그 결과이다. import matplotlib.pyplot as plt plt.rc("font", family='NanumGothic') plt.title("막대그래프(bar)") x_data=[1,3,5,7,9] y_data=[5,7,6,1,4] plt.bar(x_data,y_data) #bar(막대를 표시할 위치, 막대의 높이) plt.show() barh() 함수를 통해 막대그래프를 수직이 아닌 수평 방향으로 그릴 수 있다. import matplotlib.pyplot as plt plt.rc("font", family='..
matplotlib 라이브러리란? 파이썬에서 데이터 시각화를 할 때, matplotlib이라는 라이브러리를 가장 많이 사용한다. matplotlib 라이브러리는 파이썬에서 2D형태의 그래프, 이미지 등을 그릴 때 사용하는 것으로, 실제 과학 컴퓨팅 연구 분야나 인공지능 연구 분야에서도 많이 활용된다. matplotlib에 관해서만 책 한 권 이상의 분량이 나올 정도로 내용이 방대하다. 꺽은 선(plot) 아래 코드는 [10,20,30,40,50]이라는 값만을 가지고 plot을 그린 것이다. 이 값들이 x축을 가리킬지, y축을 가리킬지 모르겠다면 출력 결과를 통해 알 수 있다. [10,20,30,40,50]은 바로 y축 값들이다. x축의 값들을 생략할 경우 x축은 range(y축 데이터 개수)로 표현된다...