본문 바로가기

decision tree4

[데이터 사이언스 스쿨] 8.1 의사결정나무 ○ 의사결정나무(decision tree)를 이용한 분류법은 다음과 같다. 여러가지 독립 변수 중 하나의 독립 변수를 선택하고 그 독립 변수에 대한 기준값(threshold)을 정한다. 이를 분류 규칙이라고 한다. 전체 학습 데이터 집합(부모 노드)을 해당 독립 변수의 값이 기준값보다 작은 데이터 그룹(자식 노드 1)과 해당 독립 변수의 값이 기준값보다 큰 데이터 그룹(자식 노드 2)으로 나눈다. 각각의 자식 노드에 대해 1~2의 단계를 반복하여 하위의 자식 노드를 만든다. 단, 자식 노드에 한가지 클래스의 데이터만 존재한다면 더 이상 자식 노드를 나누지 않고 중지한다. 이렇게 자식 노드 나누기를 연속적으로 적용하면 노드가 계속 증가하는 나무(tree)와 같은 형태로 표현할 수 있다. ○ 분류규칙을 정하.. 2021. 5. 13.
[FAST CAMPUS] Boosted decision tree를 활용한 lending club의 채무자 원리금 상환 여부 예측 Boosted decision tree를 활용한 lending club의 채무자 원리금 상환 여부 예측 from FAST CAMPUS 2016. 9. 9.
[Jen Aman] Yggdrasil: Faster Decision Trees Using Column Partitioning In Spark Yggdrasil: Faster Decision Trees Using Column Partitioning In Spark from Jen Aman 2016. 6. 23.
[Derek Kane] Data Science - Part V - Decision Trees & Random Forests Data Science - Part V - Decision Trees & Random Forests from Derek Kane 2015. 8. 17.