BRONZE

2019년 2학기 데이터마이닝 중간과제물

"2019년 2학기 데이터마이닝 중간과제물"에 대한 내용입니다.
6 페이지
어도비 PDF
최초등록일 2020.03.06 최종저작일 2019.12
6P 미리보기
  • 미리보기

    소개

    "2019년 2학기 데이터마이닝 중간과제물"에 대한 내용입니다.

    목차

    1. 데이터마이닝은 학습의 방법에 따라 지도학습과 자율학습으로 나 눌 수 있다. 각 학습방법의 의미를 설명하고 어떤 데이터마이닝 기법들이 포함되는지 기술하시오. (6점)

    2. 보스턴하우징데이터(Boston)에 다중선형회귀모형을 적합하고 자 한다. step() 함수를 이용하여 변수선택을 한 모형을 적합한다고 할 때, 변수선택 전후의 모형의 예측력을 MSE 기준으로 비교하시오. (6점)

    3. 두 변수 x1과 x2는 1, 2, 3 등 세 가지 값을 가지는 데이터가 있다. 이 데이터의 목표변수는 집단의 소속정보를 나타내는 분류분석에 적당한 데이터 이다. 2 개의 집단이 있다고 할 때, 각 집단별로 x1과 x2에 대하여 분할표를 다음 표와 같이 생성하였다. 다음 물음에 답하시오. (9점)
    (1) 지니지수를 이용하여 최적의 분리점을 찾으시오.
    (2) 뿌리노드가 한번 분할된 분류나무를 생성하고, 두 자식노드에서 관찰치 들 의 집단별 빈도를 밝히시오.
    (3) 위에서 생성된 분류나무의 오분류율을 계산하시오.

    4. 아래와 같은 범주형 변수 X1이 있다고 하자. 총 관찰치의 수는 18개이며 흰 색집단에 10개 검정색 집단에 8개의 관찰치가 포함되어 있다. 이 데이터에 CART 방법의 지니지수를 이용하여 분할집합을 찾으려 한다. 아래의 표를 채 우 고, 최적의 분할집합을 찾으라. (9점)

    본문내용

    1. 데이터마이닝은 학습의 방법에 따라 지도학습과 자율학습으로 나 눌 수 있다. 각 학습방법의 의미를 설명하고 어떤 데이터마이닝 기법들이 포함되는지 기술하시오. (6점)

    지도학습은 입력데이터에 대한 명시적인 출력값(Label)이 주어진 상태에서 입출력간의 관계에 대한 유용한 근사 시스템을 구하는 것으로 정의할 수 있고 자율학습은 지도학습과 반대로 명시적인 출력값이 존재하지 않는 상황에서 데이터의 형태 및 특징을 찾아내는데 초점을 두고있다.

    지도학습의 대표적인 학습방법으로는 회귀 및 분류가 있으며 회귀는 주로 목표변수가 연속형 변수일 경우, 분류는 목표변수가 주로 범주형 변수일 경우 사용되고 있다. 자율학습은 앞서 언급한 바와 같이 목표변수가 존재하지 않기 때문에 데이터간의 특성을 기반으로 군집을 찾는 군집분석, 연관성을 파악하고자 하는 연관성분석, 그리고 고차원 데이터간의 연관성을 바탕으로 저차원으로 변환해주는 주성분 분석 등이 있다.

    2. 보스턴하우징데이터(Boston)에 다중선형회귀모형을 적합하고 자 한다. step() 함수를 이용하여 변수선택을 한 모형을 적합한다고 할 때, 변수선택 전후의 모형의 예측력을 MSE 기준으로 비교하시오. (6점)

    설명
    MSE 기준, 전체 변수를 사용한 모델은 12.89972, step을 통해 indus, age 변수를 제거한 모델은 12.92344으로 step을 통해서 변수를 선택한 모델의 예측력이 상대적으로 안좋다고 판단하였습니다.

    참고자료

    · 없음
  • 자료후기

    Ai 리뷰
    지식판매자가 제공하는 자료는 질이 매우 높고, 주제에 대한 깊이 있는 분석이 인상적입니다. 이해하기 쉬운 설명과 다양한 예시 덕분에 활용하기 편했습니다. 정말 감사드립니다!
    왼쪽 화살표
    오른쪽 화살표
  • 자주묻는질문의 답변을 확인해 주세요

    해피캠퍼스 FAQ 더보기

    꼭 알아주세요

    • 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
      자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
      저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
    • 해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
      파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
      파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

함께 구매한 자료도 확인해 보세요!

찾으시던 자료가 아닌가요?

지금 보는 자료와 연관되어 있어요!
왼쪽 화살표
오른쪽 화살표
문서 초안을 생성해주는 EasyAI
안녕하세요. 해피캠퍼스의 방대한 자료 중에서 선별하여 당신만의 초안을 만들어주는 EasyAI 입니다.
저는 아래와 같이 작업을 도와드립니다.
- 주제만 입력하면 목차부터 본문내용까지 자동 생성해 드립니다.
- 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
- 스토어에서 무료 캐시를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
이런 주제들을 입력해 보세요.
- 유아에게 적합한 문학작품의 기준과 특성
- 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
- 작별인사 독후감
해캠 AI 챗봇과 대화하기
챗봇으로 간편하게 상담해보세요.
2025년 03월 07일 금요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
12:30 오후