의사 결정 나무 Decision Tree
분석의 목적과 자료구조에 따라서 적절한 '분리기준' + 정지규칙/가지치기를 통하여 의사결정나무를 얻는다. 모형에서 분리의 기준은 부모마디에 비해 자식마디에서 순수도(=목표변수의 특정 범주에 개체들이 포함되어 있는 정도)가 증가하는 정도를 수치화한 것이 된다. = 부모 마디에서 자식 마디로 갈수록 순수도는 증가한다. 상위의 노드로부터 하위의 노드로, 나무 구조를 형성하는 매 단계마다 분류 기준의 선택값과 분류 변수가 중요하다. 선형성, 정규성, 등분산성 등의 수학적 가정이 불필요한 비모수적 모형이다. 맨 위의 마디를 뿌리마디(Root node)라 하며, 이는 분류 또는 예측 대상이 되는 모든 자료 집단을 포함한다. 상위의 마디는 하위의 마디로 분리된다. 이때 상위 마디를 부모마디(Parent node)라고..
2022.02.24