목록히스토그램 (3)
컴공생의 다이어리
줄기-잎 그림(Stem-and-Leaf Display)이란? - 줄기 잎 그림은 숫자형 자료에 사용 - 히스토그램을 옆으로 돌려 놓은 것과 같음 - 히스토그램과 달리 정보손실 없음 - 각 자료의 값을 알 수 있어 추가 정보를 더 얻을 수 있음 - 대용량 데이터에 적용하기에는 한계가 있음 - 자료의 분포를 시각적으로 쉽게 파악하면서 각 관측값을 유지하는 방법 - 줄기(Stem)와 잎(Leaf)으로 구성 : 한 줄기에 0에서 9까지 잎이 올 수 있음 : 혹은 0-4, 5-9의 잎을 가진 두 줄기로 나뉠 수도 있고, 자료 특성에 따라 더 많은 줄기로 나뉠 수도 있음 - 작성법 관측값을 보고 앞 단위와 뒤 단위를 정함 ex) 관측값이 35인 경우 3은 앞 단위, 5는 뒤 단위 - 앞 단위를 줄기로 하여 순서대로..

히스토그램(Histogram)이란? - 막대그림과 생김새는 비슷하지만, 순서형 자료와 수치형 자료를 도수분포표를 이용해서 그래프 형태로 나타낸 것 - 일반적으로 X축은 각 계급을 나타내며, Y축은 빈도수를 나타냄 - 각 막대의 중간 포인트(X축)가 계급값을 보통 나타냄 - 자료에 대한 정보를 특징적 형태로 제공함 대칭(Symmetry) 왜도(Skewness) 그래프를 중간에서 나누어 봤을 때, 좌우가 대칭인지? 그래프가 좌우로 늘어진 정도 양의 왜도(Right Skewed) 음의 왜도(Left Skewed) 오른쪽으로 길게 늘어짐 왼쪽으로 길게 늘어짐 모양(Shape) 봉우리 개수 종 모양, L자 모양, U자 모양 단봉(Unimodal), 쌍봉(Bimodal) 상이한 집단의 자료들이 섞여 있을 때 쌍봉이..

matplotlib 라이브러리란? 파이썬에서 데이터 시각화를 할 때, matplotlib이라는 라이브러리를 가장 많이 사용한다. matplotlib 라이브러리는 파이썬에서 2D형태의 그래프, 이미지 등을 그릴 때 사용하는 것으로, 실제 과학 컴퓨팅 연구 분야나 인공지능 연구 분야에서도 많이 활용된다. matplotlib에 관해서만 책 한 권 이상의 분량이 나올 정도로 내용이 방대하다. 꺽은 선(plot) 아래 코드는 [10,20,30,40,50]이라는 값만을 가지고 plot을 그린 것이다. 이 값들이 x축을 가리킬지, y축을 가리킬지 모르겠다면 출력 결과를 통해 알 수 있다. [10,20,30,40,50]은 바로 y축 값들이다. x축의 값들을 생략할 경우 x축은 range(y축 데이터 개수)로 표현된다...