○ 보스턴 집값 예측
이 플롯의 첫 행을 보면 종속변수인 집값(MEDV)과 방 개수(RM), 노후화 정도(AGE)와 어떤 관계를 가지는지 알 수 있다.
- 방 개수가 증가할 수록 집값은 증가하는 경향이 뚜렷하다.
- 노후화 정도와 집값은 관계가 없어 보인다.
* 찰스강 유역 여부(CHAS)는 범주값이며 값이 1이면 0일 때 보다 집값의 평균이 더 높아지는 것도 볼 수 있다.
○ 당뇨병 진행도 예측
- 이 플롯을 보면, BMI지수와 평균혈압(bp)이 종속변수인 당뇨병 진행도와 양의 상관관계를 가지는 것을 볼 수 있다.
- 또한 두 독립변수 BMI지수와 평균혈압도 서로 양의 상관관계를 가진다.
--> 이렇게 독립변수끼리 상관관계를 가지는 것을 다중공선성(multicolinearity)이라고 한다. (분석 결과에 영향을 줌)
○ 가상 데이터 예측
'IT 와 Social 이야기 > Python' 카테고리의 다른 글
[데이터 사이언스 스쿨] 4.3 스케일링 (0) | 2021.05.10 |
---|---|
[데이터 사이언스 스쿨] 4.2 선형회귀분석 linear regression analysis의 기초 (0) | 2021.05.10 |
[데이터 사이언스 스쿨] ml10.1 지리 정보 데이터 처리 (0) | 2021.05.08 |
[데이터 사이언스 스쿨] ml9.2 푸리에 변환과 스펙트럼 (0) | 2021.05.08 |
[데이터 사이언스 스쿨] ml9.1 사운드 프로세싱 기초 (0) | 2021.05.08 |