① Classification
- Tree(entropy based and regression based) 예제
② Raw Data
- HMEQ data
- UCI machine learning data repository에서 발췌, 데이터 마이닝분야 및 통계분야에서 사용되는 신용평가 data set
- 구성 : 5960 records
<데이터셋 일부>
③ Input node 와 Insight node, Tree node, Regression node, Assessment node 로 모델링한 모습
1) Input node 및 Insight node를 통한 Bad 변수의 분포 확인
- Class label인 Bad( type: binary )의 모델 역할에 target으로 설정함
2) Tree node 에서의 옵션 설정
- 분류 기준 및 분류 레벨, 분지 가지의 수 등을 설정해준다.
- 여기서는 Entropy based reduction을 기본으로 수행함.
3) Regression node 에서의 옵션 설정
- Target variable이 binary 이므로 logistic regression check 및 link function은 logit으로 설정함.
④ Results
1) Tree 수행의 결과
- 위의 트리를 확인하면 level 4 의 depth로 DEBTINC, VALUE, DELINQ 순으로 분지가 되어 있음을 확인할 수 있다.
- 수입에 대한 부채 비율이 44.8 이상이고 부실거래의 수가 0.5 이상이면 대출금 상환여부가 0 일 비율이 35.%로 높음을 확인할 수 있다.
2) Regression 수행의 결과
- Regression의 수행 결과이다. Stepwise selection을 통한 분석이었으며, Target에 영향을 주는 유의한 변수로서 DELIQ, DEBTINC, DEROG, CLASE 가 선택되었음을 확인 할 수 있다.
자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다. 자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다. 저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
파일오류
중복자료
저작권 없음
설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우