목록분석 (3)
컴공생의 다이어리
산점도(Scatter Plot)란? - 변수가 2가지 이상일 때 두변수의 연관성을 보여줌 - 각 자료의 변수 A의 값을 X값, 변수 B값을 Y값으로 정하여 점으로 표시 - 선형성(Linearity) : 두 변수의 연관성을 뜻하며, 양의 선형 관계, 음의 선형 관계가 있음 출처 : EXCEL, SPSS, R로 배우는 통계학입문/강상욱 외 8인 공저/자유아카데미/2014
기술통계(Descriptive Statistics)란? - 자료 전체의 속성을 파악할 수 있도록 요약, 기술해 주는 통계적 방법 - 세밀한 분석을 위한 기초단계 - 표나 그래프를 이용한 기술 통계 : 도수분포표, 히스토그램, 막대 그림 등 - 수치에 의한 기술 통계 : 중심경향성(→ 평균, 중앙값, 최빈값), 산포도(→ 범위, 분산, 표준편차) 표나 그래프를 이용한 기술 통계 - 통계학에 대한 전문적인 지식이 없는 경우에도 쉽게 자료의 특성을 파악할 수 있도록 시각적 그래프로 표현한 기초적인 자료 요약방법 - 대표적 : 도수분포표, 막대 그림, 파이 그림, 히스토그램, 상자그림, 산점도, 줄기와 잎 그림 등 수치에 의한 기술 통계 - 숫자를 이용하여 자료의 정보를 요약 기술 하는 것 - 모집단으로부터 얻..
matplotlib 라이브러리란? 파이썬에서 데이터 시각화를 할 때, matplotlib이라는 라이브러리를 가장 많이 사용한다. matplotlib 라이브러리는 파이썬에서 2D형태의 그래프, 이미지 등을 그릴 때 사용하는 것으로, 실제 과학 컴퓨팅 연구 분야나 인공지능 연구 분야에서도 많이 활용된다. matplotlib에 관해서만 책 한 권 이상의 분량이 나올 정도로 내용이 방대하다. 꺽은 선(plot) 아래 코드는 [10,20,30,40,50]이라는 값만을 가지고 plot을 그린 것이다. 이 값들이 x축을 가리킬지, y축을 가리킬지 모르겠다면 출력 결과를 통해 알 수 있다. [10,20,30,40,50]은 바로 y축 값들이다. x축의 값들을 생략할 경우 x축은 range(y축 데이터 개수)로 표현된다...