소개글
"[30점 만점] [데이터과학개론] 2022 2학기 중간과제물 한국방송통신대학교 통계데이터과학과"에 대한 내용입니다.
목차
1. 범주형 데이터 및 수치형 데이터의 특징 및 종류를 기술하고 사례를 제시하고 설명하시오. (단, 교재 외의 사례를 제시할 것)
2. 빅테이터 시대에 접어들어 인공지능 등 첨단 기술의 발전이 가속화되는 상황에서 ‘데이터 주도권’이라는 개념이 강조되는 이유에 대해 자신의 생각을 독창적으로 기술하시오. (분향 : 문제를 제회하고 한글 11pt 줄간격 160%, MS word 기준 글자 크기 11pt 줄간격 1.5로 하여 A4 1매 이상 기술할 것) --> 서술형 기술
3. 데이터베이스 모델이란 무엇인지 설명하고, 계층형, 네트워크형, 관계형 모델 각각에 대해 교재 외의 사례를 들어 설명하시오.
4. 데이터 품질관리의 미흡할 때 발생할 수 있는 문제에 대해 약숙하고 이러한 문제가 발생한 (교재 외의) 실제 사례를 조사하여 기술하시오. (분량 : 문제를 제외하고 한글 11pt 줄간격 160%, MS word 기준 글자 크기 11pt 줄간격 1.5로 하여 A4 1매 이상 기술할 것)
5. Reference
본문내용
범주형 데이터는 수치로는 측정이 가능하지 않는 데이터이며, 질적 데이터라고도 불린다. 범주형 데이터에는 명목형 데이터와 순서형 데이터가 있다. 명목형 데이터와 순서형 데이터의 차이는 순서의 유무 차이이다. 명목형 데이터는 순서가 의미가 없고 순서형은 순서에 의미가 있다. 명목형 데이터의 예시로는 성별, 성, 이름, 거주지역, 기혼여부, 출신 고등학교 등이 있겠다. 순서형은 학점(A,B,C), 국가신용등급, 자동차 에너지소비효율 등급, NRS 통증척도, GCS score 등이 있다.
수치형 데이터는 수치로 측정이 가능한 데이터이며, 양적 데이터라고도 불린다. 수치형 데이터에는 이산형 데이터 및 연속형 데이터가 있다. 이산형 데이터와 연속형 데이터는 양적인 크기가 있지만, 이산형 데이터은 연속적이지 않는 반면, 연속형 데이터는 연속적인 관측 값을 나타낼 수 있다. 이산형 데이터의 예로는 보유하고 있는 자동차 대수, 자녀 수, 건물 층수 등이 있다. 연속형 데이터의 예로는 키, 체중, 통장 잔고, 살고 있는 집 평수, 3대 중량 등이 있다.
참고 자료
https://ko.wikipedia.org/wiki/%EB%84%A4%ED%8A%B8%EC%9B%8C%ED%81%AC_%EB%AA%A8%EB%8D%B8
https://ko.wikipedia.org/wiki/%EA%B3%84%EC%B8%B5%ED%98%95_%EB%AA%A8%EB%8D%B8
https://ko.wikipedia.org/wiki/%EA%B4%80%EA%B3%84%ED%98%95_%EB%AA%A8%EB%8D%B8
Margi Murphy, 혼다, “데이터베이스 오류때문에” 766억 벌금. 업계 사상 최대, Computerworld UK, 2015.01.12, https://www.itworld.co.kr/tags/35161/%ED%98%BC%EB%8B%A4/91341
장영재, 데이터과학개론, 한국방송통신대학교출판문화원(2022), p69