본문 바로가기

prediction19

[데이터 사이언스 스쿨] 4.1 회귀분석 regression analysis 예제 특정한 입력변수값을 사용하여 출력변수의 값을 계산하는 것을 예측(prediction)문제라고 한다. 예측문제 중에서 출력변수의 값이 연속값인 문제를 회귀(regression) 또는 회귀분석(regression analysis) 문제라고 한다. ○ 보스턴 집값 예측 이 플롯의 첫 행을 보면 종속변수인 집값(MEDV)과 방 개수(RM), 노후화 정도(AGE)와 어떤 관계를 가지는지 알 수 있다. 방 개수가 증가할 수록 집값은 증가하는 경향이 뚜렷하다. 노후화 정도와 집값은 관계가 없어 보인다. * 찰스강 유역 여부(CHAS)는 범주값이며 값이 1이면 0일 때 보다 집값의 평균이 더 높아지는 것도 볼 수 있다. ○ 당뇨병 진행도 예측 - 이 플롯을 보면, BMI지수와 평균혈압(bp)이 종속변수인 당뇨병 진행도.. 2021. 5. 9.
[데이터 사이언스 스쿨] ml1.1 데이터 분석의 소개 ● 예측(prediction) : 예측이란 숫자, 문서, 이미지, 음성, 영상 등의 여러 가지 입력 데이터를 주면, 데이터 분석의 결과로 다른 데이터를 출력하는 분석 방법이다. - 데이터 분석에서 말하는 예측이라는 용어는 시간상으로 미래의 의미는 포함하지 않는다. 시계열 분석에서는 시간상으로 미래의 데이터를 예측하는 경우가 있는데 이 때는 미래예측(forecasting) 이라는 용어를 사용한다. ● 입력 데이터(input data) : 분석의 기반이 되는 데이터로 보통 알파벳 X로 표기한다. - 독립변수(independent variable), 특징(feature), 설명변수(explanatory variable) 등의 용어로 쓰기도 한다. ● 출력 데이터(output data) : 추정하거나 예측하고자.. 2021. 5. 5.
[빵형의 개발도상국] 코로나 바이러스 확진자 수 예측하기 - Python *** 시계열 데이터를 활용하여 코로나 바이러스의 대한민국 확진자를 7일 후까지 예측 *** Source code(Github): https://github.com/kairess/corona-vir... *** Dependencies: - Python - pandas - fbprophet - plotly *** Dataset: Corona-02-21-202: https://www.kaggle.com/thaile1001/cor... 2020. 7. 6.
[Tech With Tim] Python Machine Learning Tutorial #2 - Linear Regression p.1 *** Python Machine Learning 2 : Linear Regression p.1 선형회귀분석 - Data Collection - Trimming Data - Linear Regression - Prediction *** UCI Data Set: https://archive.ics.uci.edu/ml/datase... 2020. 5. 13.