Rapid Miner를 이용한 데이터마이닝 연관성분석

cocohjjjj

개인인증 판매자스토어

최초 등록일: 2020.09.12
최종 저작일: 2015.06; 13페이지/ 한컴오피스; 가격 2,500원

다운로드

장바구니

상세정보
자료후기 (1)
자료문의 (0)
판매자정보

소개글

Kaggle 캐글 대회에 참가하여 Rapid Mining을 통해 데이터 분석한 연구에 대한 보고서 입니다.

1. 선정배경

2. 프로젝트 소개
2-1 Train data
2-2 Test data

3. 프로젝트 진행 방향
3-1 데이터 탐색
3-2 데이터 활용계획
3-3 변수 만들기
3-3-1 Rapid Miner 이용
3-3-2 Wordnet 이용
3-3-3 Excel 이용
3-4 첫 번째 모델 만들기
3-4-1. Test data의 분산 변수 예측하기
3-4-2. Rapid Miner로 타겟변수 예측
3-4-3. 결과 도출 및 제출
3-4 변수의 확장
3-5 두 번째 모델 만들기

4. 완성 도출

5. 학습 후 배운점

본문내용

1. 선정 배경
우리는 하루에도 수십 건의 질문과 탐색을 인터넷 검색을 통해서 하게 된다. 우리가 셀 수도 없이 많이 하는 검색을 통해 나오는 우리에게 보여 지는 검색결과가 우리가 정말 원하던 정보가 나올 때도 나오지 않을 때도 있다. 하지만 구글, 아마존 등 유명 IT기업은 더 나아가 딥 러닝(Deep Learning)으로 사이트에 존재하는 다양한 정보의 연관성을 분석하여 인간의 행동패턴, 좋아하는 것을 분석하는 알고리즘을 개발하여 고객편의 서비스를 제공하고 있다. 이러한 텍스트들의 관련성의 관련성이 최근 중요하게 부각되고 있기에 본 프로젝트에 도전의식을 가지고 참여하게 되었다. 소셜 SNS 텍스트로 감정분석을 분석하는 시대에 Text mining은 매력적인 과제라고 생각했다.

2. 선정 프로젝트 소개
eCommerce 사이트 내 검색결과의 연관성을 예측하는 것이 본 프로젝트의 과제이다. eCommerce 사이트 검색창에 단어(query)를 입력했을 때, 단어의 의도와 제품 결과들이 서로 상관관계가 있는지. 제품결과들 간의 상관관계가 있는지 그 연관성을 모델화하여 오픈소스를 만드는 것이 프로젝트의 목적이다.

참고 자료

없음

환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류	중복자료	저작권 없음	설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우	다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함)	인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우	자료의 설명과 실제 자료의 내용이 일치하지 않는 경우