Rapid Miner를 이용한 데이터마이닝 연관성분석
- 최초 등록일
- 2020.09.12
- 최종 저작일
- 2015.06
- 13페이지/ 한컴오피스
- 가격 2,500원
소개글
Kaggle 캐글 대회에 참가하여 Rapid Mining을 통해 데이터 분석한 연구에 대한 보고서 입니다.
목차
1. 선정배경
2. 프로젝트 소개
2-1 Train data
2-2 Test data
3. 프로젝트 진행 방향
3-1 데이터 탐색
3-2 데이터 활용계획
3-3 변수 만들기
3-3-1 Rapid Miner 이용
3-3-2 Wordnet 이용
3-3-3 Excel 이용
3-4 첫 번째 모델 만들기
3-4-1. Test data의 분산 변수 예측하기
3-4-2. Rapid Miner로 타겟변수 예측
3-4-3. 결과 도출 및 제출
3-4 변수의 확장
3-5 두 번째 모델 만들기
4. 완성 도출
5. 학습 후 배운점
본문내용
1. 선정 배경
우리는 하루에도 수십 건의 질문과 탐색을 인터넷 검색을 통해서 하게 된다. 우리가 셀 수도 없이 많이 하는 검색을 통해 나오는 우리에게 보여 지는 검색결과가 우리가 정말 원하던 정보가 나올 때도 나오지 않을 때도 있다. 하지만 구글, 아마존 등 유명 IT기업은 더 나아가 딥 러닝(Deep Learning)으로 사이트에 존재하는 다양한 정보의 연관성을 분석하여 인간의 행동패턴, 좋아하는 것을 분석하는 알고리즘을 개발하여 고객편의 서비스를 제공하고 있다. 이러한 텍스트들의 관련성의 관련성이 최근 중요하게 부각되고 있기에 본 프로젝트에 도전의식을 가지고 참여하게 되었다. 소셜 SNS 텍스트로 감정분석을 분석하는 시대에 Text mining은 매력적인 과제라고 생각했다.
2. 선정 프로젝트 소개
eCommerce 사이트 내 검색결과의 연관성을 예측하는 것이 본 프로젝트의 과제이다. eCommerce 사이트 검색창에 단어(query)를 입력했을 때, 단어의 의도와 제품 결과들이 서로 상관관계가 있는지. 제품결과들 간의 상관관계가 있는지 그 연관성을 모델화하여 오픈소스를 만드는 것이 프로젝트의 목적이다.
참고 자료
없음