방송통신대 2022년 2학기 중간 과제물 빅데이터의 이해와 활용 30점 만점
아트릭스
다운로드
장바구니
과제정보
학과 | 컴퓨터과학과, 통계·데이터과학과 | 학년 | 4학년 |
---|---|---|---|
과목명 | 빅데이터의이해와활용 | 자료 | 10건 |
공통 |
(1) 다음을 정리하여 서술하시오(10점)
① 빅데이터 ② 데이터경제 (2) 네이버 검색어트렌드를 이용하여 COVID-19 전 후의 사회 또는 경제의 변화를 악하려고 한다. 비교가능한 검색 주제어 2개를 찾고, 이를그래프로 비교한 후, 의...
(1) 다음을 정리하여 서술하시오(10점)
① 빅데이터 ② 데이터경제 (2) 네이버 검색어트렌드를 이용하여 COVID-19 전 후의 사회 또는 경제의 변화를 악하려고 한다. 비교가능한 검색 주제어 2개를 찾고, 이를그래프로 비교한 후, 의미있는 결론을 도출하여 기술하시오(주제어 내 키워드는 의미있는 여러 개를 지정) (8점). (3) 다음을 기술하시오(12점). ① 구글 Ngram Viewer를 이용하여 1900년대 이후 관련 있는 키워드(영어) 3개를 찾아 그래프로 정리하고, 의미를 쓰시오. ② ①과 동일한 키워드(영어) 3개를 구글 트렌드에서 찾아 2004년 이후 그래프로 정리하고, 의미를 쓰시오. ③ ①의 결과와 ②의 결과를 연계해서 종합적으로 의미를 찾아 기술하시오. |
* 본 문서(hwp)가 작성된 한글 프로그램 버전보다 낮은 한글 프로그램에서 열람할 경우 문서가 올바르게 표시되지 않을 수 있습니다. 이 경우에는 최신패치가 되어 있는 2010 이상 버전이나 한글뷰어에서 확인해 주시기 바랍니다.
소개글
"방송통신대 2022년 2학기 중간 과제물 빅데이터의 이해와 활용 30점 만점"에 대한 내용입니다.목차
(1) 다음을 정리하여 서술하시오(10점)① 빅데이터 ② 데이터경제
(2) 네이버 검색어트렌드를 이용하여 COVID-19 전 후의 사회 또는 경제의 변화를 파악하려고 한다. 비교가능한 검색 주제어 2개를 찾고, 이를 그래프로 비교 한 후, 의미있는 결론을 도출하여 기술하시오(주제어 내 키워드는 의미있는 여러 개를 지정) (8점).
(3) 다음을 기술하시오(12점).
① 구글 Ngram Viewer를 이용하여 1900년대 이후 관련 있는 키워드(영어) 3개를 찾아 그래프로 정리하고, 의미를 쓰시오.
② ①과 동일한 키워드(영어) 3개를 구글 트렌드에서 찾아 2004년 이후 그래프로 정리하고, 의미를 쓰시오.
③ ①의 결과와 ②의 결과를 연계해서 종합적으로 의미를 찾아 기술하시오.
본문내용
1) 다음을 정리하여 서술하시오(10점)① 빅데이터
사물에 센서의 부착이 늘어나고 IT기술의 발달과 인터넷, 모바일 등 기기들의 보급으로 디지털 세계에 살고 있다고 해도 과언이 아닐 것이다. 디지털 세계에서 서로 연결되고, 지능화되면서, 데이터는 기하급수적으로 증가했다. 이렇게 생겨나는 수많은 데이터의 양을 통상적으로 빅데이터 라고 한다. 이렇게 다양한 방면에서 데이터를 수집, 처리하고 분석해서 데이터로부터 얻은 통찰력을 통해 가치가 생성되면서 단순히 많은 양만으로 빅데이터 여부를 구분하는 것은 무리가 있다고 보았으며 보관 및 관리의 필요성도 증가하고 있다. 빅데이터의 특성을 설명하기 위해 가트너의 Volume(양), Variety (다양성), Velocity(속도) 3V개념과 브라이언 홉킨스 등이 언급한 Veracity(정확성), Value (가치)가 합쳐저 5V개념이 사용되고 있다.
-Volume (양)
기본적으로 매우 많은 양이 빅데이터를 의미하고 특히나 머신러닝, 딥러닝 모형 규모가 커야만 의미를 가질 수 있으며 데이터의 양이 많으면 많을수록 세분화 하여 정확성이 높아진다. 빠르게 데이터의 양이 증가하고 기준 수치에 대한 명확한 수치는 변화하고 있다.
-Variety (다양성)
분석이 불가능해 인식되지 않거나 분석이 불가능 하던 데이터들이 양과 종류가 많아지면서 가치를 가지게 된다. 새로 생성되는 전세계의 데이터 비중의 80%이상이 비(반)정형데이터인 텍스트, 이미지, 오디오, 비디오 등이며, 기업은 점차 정형데이터(관계형 DB)에서 비(반)정형 데이터로 분석의 대상이 확대되고 있다.
-Velocity (속도)
전세계에서 실시간으로 엄청난 데이터가 생성되고 많은 양을 로드할 수 있다. 소셜미디어, 유튜브 등 몇초만에 엄청난 글과 영상이 보여지고 인지하게 된다. 이에 따라 대용량 데이터 및 실시간 스트리밍 데이터들을 효율적으로 운영하고 분석하는 기술과 업무가 증가하고 있다.
참고 자료
김욱원, (2016). 빅데이터를 활용한 뉴스 콘텐츠가 기사의 차별성에 미치는 영향 : 경제뉴스 콘텐츠를 중심으로, 중앙대학교 대학원, 석사학위논문.박준협, (2022). 데이터경제 활성화를 위한 데이터 재산권 인정 방안 연구, 단국대학교 대학원, 박사학위논문.