(빅데이터의 이해) 다음을 설명하시오
하늘바람1
다운로드
장바구니
과제정보
학과 | 컴퓨터과학과, 통계·데이터과학과 | 학년 | 4학년 |
---|---|---|---|
과목명 | 빅데이터의이해 | 자료 | 3건 |
공통 |
1. 다음을 설명하시오.(6점)
(1) 데이터과학 (2) 빅데이터 2. 다음에 대해 답하시오.(18점) (1) 네이버 트렌드를 이용하여 비교가능한 검색 주제어 2개를 비교하고 그래프로 정리하어 의미있는 결론을 도출하여 기술하시오(주...
1. 다음을 설명하시오.(6점)
(1) 데이터과학 (2) 빅데이터 2. 다음에 대해 답하시오.(18점) (1) 네이버 트렌드를 이용하여 비교가능한 검색 주제어 2개를 비교하고 그래프로 정리하어 의미있는 결론을 도출하여 기술하시오(주제어별 키워드는 의미있는 여러 개를 지정) . (2) 구글 Ngram을 이용하여 1900년대 이후 관련 있는 키워드(영어) 3개를 찾아 그래프로 정리하고 그 의미를 정리하시오. (3) 구글 트렌드를 이용하여 (2)에서 찾은 동일 키워드(영어) 3개를 찾아 그래프를 작성하고 이를 (2)의 결과와 연계해서 비교하여 설명하시오. 3. 기업, 정부에서 빅데이터를 이용하여 얻은 최신 성과 사례를 발굴하고 이를 정리하시오.(6점) <공통사항> ※ 1번 : 최신 변화 내용을 포함하여 이해하기 쉽게 정리하시오. 교재 내용을 그대로 쓰는 경우 감점합니다. 2번 : (1) http://datalab.naver.com/ 의 검색어 트렌드를 이용한다. (2) books.google.com/ngrams에 비교가능한 키워드를 영어로 입력해야 하며 그들의 의미를 파악하고 비교하여 기술한다. (3) 구글 트렌드(www.google.com/trends/)를 이용하며 (2)와 동일 키워드를 이용하며 기술방식은 (2)과 동일하다. 3번 : 가급적 최신 사례를 발굴해야 하며 출처를 명확하게 밝혀야 한다. 출처를 그대로 복사하지 말고 정리하여 본인의 의견을 개진해야 한다. ※ 전체적으로 10페이지 이내로 작성한다. ※ 본인 스스로 내용을 요약해서 정리해야 함 (인터넷 내용을 그대로 긁어오거나 동료와 유사한 경우(시스템에서 점검함) 감점, 0점 처리) |
소개글
"(빅데이터의 이해) 다음을 설명하시오"에 대한 내용입니다.목차
1. 다음을 설명하시오.(1) 데이터과학
(2) 빅데이터
2. 다음에 대해 답하시오.
(1) 네이버 트렌드를 이용하여 비교 가능한 검색 주제어 2개를 비교하고 그래프로 정리하여 의미 있는 결론을 도출하여 기술하시오(주제어별 키워드는 의미 있는 여러 개를 지정) .
(2) 구글 Ngram을 이용하여 1900년대 이후 관련 있는 키워드(영어) 3개를 찾아 그래프로 정리하고 그 의미를 정리하시오.
(3) 구글 트렌드를 이용하여 (2)에서 찾은 동일 키워드(영어) 3개를 찾아 그래프를 작성하고 이를 (2)의 결과와 연계해서 비교하여 설명하시오.
3. 기업, 정부에서 빅데이터를 이용하여 얻은 최신 성과 사례를 발굴하고 이를 정리하시오.
본문내용
1. 다음을 설명하시오.(6점)1-1. 데이터과학
짐 그레이(Jim Gray)는 데이터 과학을 네 번째 패러다임으로 정의하였다. 20세기 중반 폰 노이만에 의해 나타난 세 번째 패러다임이 대규모 컴퓨터 시뮬레이션을 정의하였다면 네 번째 패러다임은 전통적인 의미의 과학 이론이 상호 작용하여 보완할 수 있는 통합 프레임 워크를 제공하며, 실험과 실험에 의해 규정된 현상에 대한 설명을 필요로 하는 것이라고 이야기 하였다. 세 번째 패러다임이 단순히 대규모의 데이터를 차지할 수 있는 크기(Volume)에 대한 이야기라면, 네 번째 패러다임은 이 데이터의 범람 때문에 이제까지 과학이 이야기 하였던 이론과 경험이 바뀌고 있음을 이야기 한 것으로 보인다.
드류 콘웨이(Drew Conway)는 데이터 과학이라는 기술을 정의하는데 물질과 방법론 사이의 구분이 모호하기 때문에 이 용어가 약간 잘못된 것이라고 생각한다. 이 모호함은 해커나 통계자(Statisticians), 주제 전문가(Subject matter experts)가 각각 다루고 있는 데이터의 접합되는 부분이나 데이터가 적용되는 것에 대한 모호함을 이야기를 하고 있다.
<중 략>
1-2. 빅데이터
1990년대 후반 김대중 정부는 ‘PC 보급’을 정책적으로 추진하였다. 정보의 격차를 해소하기 위한 정책의 일환으로서 당시에 우체국 등에서 저렴하게 PC를 구입할 수 있었다. 이 이후 컴퓨터와 인터넷 사업이 본격적 추진되기 시작하면서 주변 가정에서 PC를 보는 것은 흔한 일이 되었으며 보급률은 꾸준히 상승하여 각 가정 당 한 대의 PC를 소유하거나 스마트폰 등의 사용으로 인해 인터넷을 사용하는 것은 어렵지 않은 일이 되었다. 당시 느린 인터넷 속도와 컴퓨터의 개발로 인해 각 개인이 접할 수 있는 것은 저품질의 이미지와 텍스트 위주의 데이터였다. 하지만 오늘날 인터넷 속도의 향상과 컴퓨터 기술의 발달로 인해 개인이 접할 수 있는 데이터의 크기는 점차 증가하였으며, 인터넷을 활용할 수 있는 용도도 점차 확대됨에 따라 쉽게 정리할 수 있었던 기존의 정형적이었던 것과는 달리 실시간으로 비정형적인 데이터를 생산하고 소비하는 일이 많아졌다.
참고 자료
Clifford Lynch, Jim Gray‘s Fourth paradigm and the Construction of the scientific record, Microsoft CorporationDrew Conway, THE DATA SCIENCE VENN DIAGRAM
DataRobot, Data Science, What is Data Science?
과학기술정보통신부, 인터넷 보급률 및 컴퓨터 보유율
Mckinsey Global Institute, Big data
매일경제, 빅데이터 세상