목록그림 (3)
컴공생의 다이어리

시계열 그림(Time Series Plot)이란? - 시간의 변화에 따라 얻게 되는 시계열 자료를 그래프로 표현 - X축은 시간의 흐름, Y축은 해당 시간의 자료 값을 의미 아래 그림에서 X축(=시간의 흐름)은 수면시간이고 Y축은 유병률 출처 : EXCEL, SPSS, R로 배우는 통계학입문/강상욱 외 8인 공저/자유아카데미/2014

상자 그림(Box Plot)이란? - 자료를 개괄적으로 알아보기 위해 사용하는 그래프 - 숫자형 자료에 사용 - 상자수염그림(box and whisker plot)이라고도 함 - 다섯숫자요약(Five-number summary) 최소값(Minimum), 제 1사분위수(First Quartile, 25%), 중앙값(Median, 50%), 제 3사분위수(Third Quartile, 75%), 최대값(Maximum) 최소값과 최대값으로 인해 상자의 수염의 길이가 결정 제 1사분위수와 제 3사분위수의 값으로 인해 상자의 길이가 결정 중앙값이 상자 가운데 선의 위치를 결정 - 장점 : 전체적인 분포를 알 수 있으며, 잠재적 이상치(Outlier)를 구분 가능 - 작성법 크기순 재정렬 사분위수를 결정 제 1사분위..
줄기-잎 그림(Stem-and-Leaf Display)이란? - 줄기 잎 그림은 숫자형 자료에 사용 - 히스토그램을 옆으로 돌려 놓은 것과 같음 - 히스토그램과 달리 정보손실 없음 - 각 자료의 값을 알 수 있어 추가 정보를 더 얻을 수 있음 - 대용량 데이터에 적용하기에는 한계가 있음 - 자료의 분포를 시각적으로 쉽게 파악하면서 각 관측값을 유지하는 방법 - 줄기(Stem)와 잎(Leaf)으로 구성 : 한 줄기에 0에서 9까지 잎이 올 수 있음 : 혹은 0-4, 5-9의 잎을 가진 두 줄기로 나뉠 수도 있고, 자료 특성에 따라 더 많은 줄기로 나뉠 수도 있음 - 작성법 관측값을 보고 앞 단위와 뒤 단위를 정함 ex) 관측값이 35인 경우 3은 앞 단위, 5는 뒤 단위 - 앞 단위를 줄기로 하여 순서대로..