1. summary 함수로 결정 트리 해석하기
- summary 함수를 사용하면 결정 트리의 내용을 보다 상세하게 알 수 있다.
- variable importance 행은 설명 변수의 중요성을 순서대로 보여준다.
- P(node)는 이 노드에 도달할 확률
2. 결정 트리 시각화하기 (rpart.plot 라이브러리 사용)
library(rpart.plot)
rpart.plot(r, type = 4)
3. 결정 트리의 장점과 단점
① 장점
- 결정 트리의 예측 결과는 해석이 가능하다.
- 예측 과정이 매우 빠르다.
- 여러 개의 결정 트리를 결합하면 높은 성능의 예측기를 만들 수 있다.
- 결측값을 가진 샘플을 처리할 수 있다.
- 범주형 변수를 그대로 사용할 수 있다.
② 단점: 성능이 낮다.
-> 높은 성능이 요구되는 응용에서 결정 트리를 그대로 사용하는 경우는 거의 없다.
여러 결정 트리의 의사 결정을 결합하여 높은 성능을 추구하는 랜덤 포리스틀 사용한다.
728x90
'Programing > R' 카테고리의 다른 글
R 오류 해결법 <In scan(file = file, what = what, sep = sep, quote = quote, dec = dec, : EOF within quoted string> (0) | 2021.12.17 |
---|---|
[R] 랜덤 포리스트 (0) | 2021.12.02 |
[R] 결정 트리 함수의 사용 (rpart) (0) | 2021.11.30 |
[R] 결정 트리의 원리 (0) | 2021.11.30 |
[R] 회귀와 분류 (0) | 2021.11.30 |
댓글