목록상관계수 (2)
컴공생의 다이어리
seaborn의 heatmap과 pairplot으로 상관계수 시각화 In [1]: import pandas as pd import matplotlib.pyplot as plt import seaborn as sns In [2]: test_df = pd.DataFrame({"v1":[100,200,300,400], "v2":[400,200,100,250], "v3":[40,60,60,100]}) test_df Out[2]: v1 v2 v3 0 100 400 40 1 200 200 60 2 300 100 60 3 400 250 100 corr함수는 상관계수를 구하는 함수이며 pearson은 상관계수를 구하는 계산 방법 중 하나 In [3]: corr = test_df.corr(method='pearson')..
연관성 척도(Measure of Association)란? - 2개 또는 그 이상의 항목에 대한 자료들이 상호 관련되어 있는지를 나타내는 척도 - 선형 관계(Linear relationship)에 대한 연관성 척도에는 공분산(Covariance), 상관계수(Correlation Coefficient)가 있음 공분산(Covariacne) - 두 변수 (X, Y)가 자기 평균으로부터 떨어진 값을 서로 곱한 후, 모두 합하여 모집단에서는 N, 표본에서는 n-1로 나눈 값 모집단 공분산 표본 공분산 - 두 변수가 어느 방향(부호, sign)으로 얼마나 변동(크기, magnitude)하는 지를 나타냄 공분산 속성 x와 y는 양의 선형관계 x와 y는 음의 선형관계 x와 y는 선형적 관계를 갖지 않음 상관계수(Cor..