• 통큰쿠폰이벤트-통합

2019년 2학기 데이터마이닝 중간과제물

보노코리아
개인인증판매자스토어
최초 등록일
2020.03.06
최종 저작일
2019.12
6페이지/ 어도비 PDF
가격 4,500원 할인쿠폰받기
다운로드
장바구니
  • EasyAI 홍보배너

소개글

"2019년 2학기 데이터마이닝 중간과제물"에 대한 내용입니다.

목차

1. 데이터마이닝은 학습의 방법에 따라 지도학습과 자율학습으로 나 눌 수 있다. 각 학습방법의 의미를 설명하고 어떤 데이터마이닝 기법들이 포함되는지 기술하시오. (6점)

2. 보스턴하우징데이터(Boston)에 다중선형회귀모형을 적합하고 자 한다. step() 함수를 이용하여 변수선택을 한 모형을 적합한다고 할 때, 변수선택 전후의 모형의 예측력을 MSE 기준으로 비교하시오. (6점)

3. 두 변수 x1과 x2는 1, 2, 3 등 세 가지 값을 가지는 데이터가 있다. 이 데이터의 목표변수는 집단의 소속정보를 나타내는 분류분석에 적당한 데이터 이다. 2 개의 집단이 있다고 할 때, 각 집단별로 x1과 x2에 대하여 분할표를 다음 표와 같이 생성하였다. 다음 물음에 답하시오. (9점)
(1) 지니지수를 이용하여 최적의 분리점을 찾으시오.
(2) 뿌리노드가 한번 분할된 분류나무를 생성하고, 두 자식노드에서 관찰치 들 의 집단별 빈도를 밝히시오.
(3) 위에서 생성된 분류나무의 오분류율을 계산하시오.

4. 아래와 같은 범주형 변수 X1이 있다고 하자. 총 관찰치의 수는 18개이며 흰 색집단에 10개 검정색 집단에 8개의 관찰치가 포함되어 있다. 이 데이터에 CART 방법의 지니지수를 이용하여 분할집합을 찾으려 한다. 아래의 표를 채 우 고, 최적의 분할집합을 찾으라. (9점)

본문내용

1. 데이터마이닝은 학습의 방법에 따라 지도학습과 자율학습으로 나 눌 수 있다. 각 학습방법의 의미를 설명하고 어떤 데이터마이닝 기법들이 포함되는지 기술하시오. (6점)

지도학습은 입력데이터에 대한 명시적인 출력값(Label)이 주어진 상태에서 입출력간의 관계에 대한 유용한 근사 시스템을 구하는 것으로 정의할 수 있고 자율학습은 지도학습과 반대로 명시적인 출력값이 존재하지 않는 상황에서 데이터의 형태 및 특징을 찾아내는데 초점을 두고있다.

지도학습의 대표적인 학습방법으로는 회귀 및 분류가 있으며 회귀는 주로 목표변수가 연속형 변수일 경우, 분류는 목표변수가 주로 범주형 변수일 경우 사용되고 있다. 자율학습은 앞서 언급한 바와 같이 목표변수가 존재하지 않기 때문에 데이터간의 특성을 기반으로 군집을 찾는 군집분석, 연관성을 파악하고자 하는 연관성분석, 그리고 고차원 데이터간의 연관성을 바탕으로 저차원으로 변환해주는 주성분 분석 등이 있다.

2. 보스턴하우징데이터(Boston)에 다중선형회귀모형을 적합하고 자 한다. step() 함수를 이용하여 변수선택을 한 모형을 적합한다고 할 때, 변수선택 전후의 모형의 예측력을 MSE 기준으로 비교하시오. (6점)

설명
MSE 기준, 전체 변수를 사용한 모델은 12.89972, step을 통해 indus, age 변수를 제거한 모델은 12.92344으로 step을 통해서 변수를 선택한 모델의 예측력이 상대적으로 안좋다고 판단하였습니다.

참고 자료

없음

자료후기(1)

보노코리아
판매자 유형Bronze개인인증

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

찾던 자료가 아닌가요?아래 자료들 중 찾던 자료가 있는지 확인해보세요

  • 데이터의이해와활용 중간과제물 (2022, 만점) 9페이지
    2022학년도 2학기 중간과제물(온라인제출용)교과목명 : 빅데이터의이해 ... 1페이지 이내)빅데이터데이터경제(2) 네이버 검색어트렌드를 이용 ... 한 분석 방법이 요구되고 이 과정에서 데이터마이닝과 시각화가 빅데이터 분석
  • 2020학년도 2학기데이터의이해 중간과제 6페이지
    2020학년도 2학기 중간과제물(온라인제출용)o 과제유형 : ( 공통 ... 규모 데이터에서 유의미한 정보를 찾아내는 데이터 마이닝 분야에서 발전 ... 했으며, 2008년에 데이터 과학자라는 직업이 등장하게 되었다.급증하는 데이터
최근 본 자료더보기
유니스터디 이벤트
2019년 2학기 데이터마이닝 중간과제물
  • 유니스터디 이벤트
AI 챗봇
2024년 11월 24일 일요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
7:57 오전
문서 초안을 생성해주는 EasyAI
안녕하세요. 해피캠퍼스의 방대한 자료 중에서 선별하여 당신만의 초안을 만들어주는 EasyAI 입니다.
저는 아래와 같이 작업을 도와드립니다.
- 주제만 입력하면 목차부터 본문내용까지 자동 생성해 드립니다.
- 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
이런 주제들을 입력해 보세요.
- 유아에게 적합한 문학작품의 기준과 특성
- 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
- 작별인사 독후감