본문 바로가기

Data Analysis42

[데이터 사이언스 스쿨] 4.2 선형회귀분석 linear regression analysis의 기초 ○ 상수항 결합(bias augmentation) : 회귀분석모형 수식을 간단하게 만들기 위해 다음과 같이 상수항을 독립변수 데이터에 추가하는 것 ○ 최소자승법(OLS: Ordinary Least Squares) : 잔차제곱합(RSS: Residual Sum of Squares)를 최소화하는 가중치 벡터를 구하는 방법 ○ 직교 방정식(normal equation) : 그레디언트가 0벡터가 되는 관계를 나타내는 식 - 출처: [데이터 사이언스 스쿨] 4.2 선형회귀분석 linear regression analysis의 기초 2021. 5. 10.
[데이터 사이언스 스쿨] ml1.1 데이터 분석의 소개 ● 예측(prediction) : 예측이란 숫자, 문서, 이미지, 음성, 영상 등의 여러 가지 입력 데이터를 주면, 데이터 분석의 결과로 다른 데이터를 출력하는 분석 방법이다. - 데이터 분석에서 말하는 예측이라는 용어는 시간상으로 미래의 의미는 포함하지 않는다. 시계열 분석에서는 시간상으로 미래의 데이터를 예측하는 경우가 있는데 이 때는 미래예측(forecasting) 이라는 용어를 사용한다. ● 입력 데이터(input data) : 분석의 기반이 되는 데이터로 보통 알파벳 X로 표기한다. - 독립변수(independent variable), 특징(feature), 설명변수(explanatory variable) 등의 용어로 쓰기도 한다. ● 출력 데이터(output data) : 추정하거나 예측하고자.. 2021. 5. 5.
[ciokorea] 우리회사는 AI. 머신러닝에 준비돼 있을까? - 10가지 체크리스트 - Martin Heller | CIO [이미지 출처: vectorportal.com] [원본기사: [ciokorea] 우리회사는 AI. 머신러닝에 준비돼 있을까? - 10가지 체크리스트 - Martin Heller | CIO] 1. 충분한 데이터는 확보했는가? - 관련 데이터가 충분한지 여부는 예측 및 기능 식별의 필요 조건 - 더 많은 요소를 고려하고 있을수록 필요한 데이터 양도 많아진다. - 다음 달 "마이애미에서 네이비 색상 반팔 블라우스의 판매 예측"시 과거 수 년 동안 축적되어 온 월별 판매 통계 데이터가 있어야만 월별, 그리고 연간 트렌드를 정확히 파악할 수 있게 된다. 물론 이는 어디까지나 표준적인 시계열 분석일 때의 이야기이고, 머신러닝을 이용하려면 통계 모델보다 더 많은 데이터를, 딥러닝은 그보다 몇 배는 더 많은 데이터를 .. 2017. 9. 1.
[Elena Sügis] Basics of Data Analysis in Bioinformatics - 생물정보학을 위한 데이터 분석 기초 Basics of Data Analysis in Bioinformatics from Elena Sügis 2017. 3. 28.