빅데이터의 과학적 탐구 R-studio 대한민국 교통하고 상해심각도 예측
- 최초 등록일
- 2019.09.29
- 최종 저작일
- 2019.06
- 27페이지/ MS 파워포인트
- 가격 1,000원
소개글
"빅데이터의 과학적 탐구 대한민국 교통하고 상해심각도 예측"에 대한 내용입니다.
목차
1. 주제 선정
2. 데이터 수집
3. 연구 목표 및 연구 내용
1) 연구 목표 설정
2) 가설 설정
3) 데이터 시각화
4. 분석 기법 설명
1) K-NN (K-Nearest Neighbor)
2) Decision Tree
3) RF (Random Forest)
5. 성능평가
1) 모델 성능 평가
2) 성능 평가 결과
6. 결론
본문내용
* 상해 심각도와 관련이 있을 것으로 생각되는 가설을 설정
- 교통사고 데이터의 경우 모든 변수가 범주형으로 구성되어 있음.
- 수치형 자료와 다르게 기초통계량 계산 또는 자료의 시각화에 어려움이 존재
- 가설 설정을 통한 데이터 이해
* 데이터 마이닝 기법을 이용한 피해자의 상해 심각도 예측
- K-Nearest Neighbor
- Decision Tree
- Random Forest
참고 자료
공공데이터포털(https://www.data.go.kr/)
이재식, 이은정, “의사결정 나무 앙상블 모델을 이용한 교통사고 분석”, 한국지능정보시스템학 회 추계학술대회 논문집, 2009
손소영, 신형원, “데이터 마이닝을 이용한 교통 사고 심각도 분류분석,” 대한 교통학회지 제 16권, 4호, 1998
문성희, “히스토그램과 랜덤포레스트를 이용한 머리 방향 인식”, 학위논문(석사), 2016
김명현, 이세호, 신동훈, “K-Nearest Neighbors(K-NN) 알고리즘을 통한 KOSPI200 선물지수 예측효과 연구”, 대한경영학회지, 2015
허균, “k-최근접 이웃 분류기에서 유전 알고리즘을 이용한 최적화 방법에 관한 연구”, 학위논문, 2008
정진호, “CBR을 활용한 랜덤포레스트 기반 사업초기단계 공사비 예측모델 개발”, 학위논문(석사), 2017
https://rpubs.com/kimwoohyung/ggplot2, 데이터 시각화 R{ggplot2}패키지 설명
사진 출처
http://taas.koroad.or.kr/web/shp/sbm/initUnityAnalsSys.do?menuId=WEB_KMP_OVT_UAS
https://terms.naver.com/entry.nhn?docId=3339801&cid=58137&categoryId=58137