본문 바로가기

파이썬406

[데이터 사이언스 스쿨] 4.1 회귀분석 regression analysis 예제 특정한 입력변수값을 사용하여 출력변수의 값을 계산하는 것을 예측(prediction)문제라고 한다. 예측문제 중에서 출력변수의 값이 연속값인 문제를 회귀(regression) 또는 회귀분석(regression analysis) 문제라고 한다. ○ 보스턴 집값 예측 이 플롯의 첫 행을 보면 종속변수인 집값(MEDV)과 방 개수(RM), 노후화 정도(AGE)와 어떤 관계를 가지는지 알 수 있다. 방 개수가 증가할 수록 집값은 증가하는 경향이 뚜렷하다. 노후화 정도와 집값은 관계가 없어 보인다. * 찰스강 유역 여부(CHAS)는 범주값이며 값이 1이면 0일 때 보다 집값의 평균이 더 높아지는 것도 볼 수 있다. ○ 당뇨병 진행도 예측 - 이 플롯을 보면, BMI지수와 평균혈압(bp)이 종속변수인 당뇨병 진행도.. 2021. 5. 9.
[데이터 사이언스 스쿨] ml10.1 지리 정보 데이터 처리 지리정보데이터, GIS(Geospatial Information System) 라고 말하는 것은 위치에 대한 정보를 광범위하게 포함하는 말이다. 예로는 좌표, 주소, 도시 , 우편번호 등이 있다. - 출처 : [데이터 사이언스 스쿨] ml10.1 지리 정보 데이터 처리 2021. 5. 8.
[데이터 사이언스 스쿨] ml9.2 푸리에 변환과 스펙트럼 ○ 퓨리에 변환(Fourier transform) - 음성(speech), 음악(music) 등의 음향(sound) 데이터에서 특징(feature)을 추출하는 방법 - 조합된 정현파의 합(하모니) 신호에서 그 신호를 구성하는 정현파들을 각각 분리해내는 방법 ○ 스펙트럼(spectrum) : 확률론적 확률과정 모형을 주파수 영역으로 변환하는 것 따라서 푸리에 변환과 달리 시계열의 위상(phase) 정보는 나타나지 않는다. - 출처 : [데이터 사이언스 스쿨] ml9.2 푸리에 변환과 스펙트럼 2021. 5. 8.
[데이터 사이언스 스쿨] ml9.1 사운드 프로세싱 기초 ○ 사운드 데이터 : 음압의 변화를 기록한 시계열 데이터 ○ 사인 함수 : 음압의 변화를 나타내는 시계열 데이터 중 가장 단순한 형태 진폭(amplitude) A: 위 아래로 움직이는 폭. 소리의 크기로 인식된다. 주파수(frequency) ω 또는 f: 진동 속도. 주파수가 높으면 빠르게 진동한다. 소리의 높낮이로 인식된다. 위상(phase) ϕ: 사인 함수의 시작 시점. 위상 만큼 출발이 늦어진다. 위상의 차이는 소리의 시간차로 인식된다. ○ wave 형식 파일 : 보통 초당 44100번 음압을 측정하고 −32768∼32767까지의 2바이트(bytes) 숫자로 기록한다. - 출처 : [데이터 사이언스 스쿨] ml9.1 사운드 프로세싱 기초 2021. 5. 8.