2022 1학기 방송통신대학교 데이터시각화 기말과제
- 최초 등록일
- 2022.05.31
- 최종 저작일
- 2022.05
- 9페이지/ MS 워드
- 가격 7,000원
소개글
"2022 1학기 방송통신대학교 데이터시각화 기말과제"에 대한 내용입니다.
목차
1. 런던 콜레라지도(교재 p.4)를 조사하고 데이터 시각화의 필요성을 설명하시오.(7점)
2. 아름답고 의미 있는 데이터 시각화 사례를 발굴하고 그 이유를 정리하시오.(7점)
3. R 패키지 “vcd”에 내장된 “Arthritis” 데이터셋은 류마티스 관절염 환자를 대상으로 한 임상시험 결과 데이터이다. 각 행은 각 환자를 나타내며, 변수 Treatment는 그룹 (Treated = 새로운 치료제를 투약한 그룹, Placebo = 위약을 받은 그룹)을 나타낸다. 변 수 Sex는 성별을, Improved는 치료 결과(None = 차도 없음, Some = 약간 좋아짐, Marked = 매우 좋아짐)를 나타낸다. 새로운 치료제 투약 여부가 치료 결과와 연관이 있는지, 성별과 치료 결과 간에 연관이 있는지를 데이터 시각화를 통해서 탐구하시오. (18 점)
4. R에 내장된 “airquality” 데이터셋은 1973년 5월부터 9월까지 뉴욕의 대기질에 관한 데 이터셋이다. 변수 Ozone은 대기 중 오존의 양, Solar.R은 태양방사선의 양, Wind는 풍 속, Temp는 기온을 나타낸다. 이 네가지 변수(Ozone, Solar.R, Wind, Temp)에 대한 산점도 행렬을 그리고, 이 산점도 행렬에서 알 수 있는 변수들 간의 관계에 대하여 서술 하시오. (18점)
본문내용
1. 런던 콜레라지도(교재 p.4)를 조사하고 데이터 시각화의 필요성을 설명하시오.(7점)
런던 콜레라지도란, 1850년대 영국에서 콜레라의 원인을 파악하기 위해 만든 지도를 일컫는다. 존 스노라는 인물이 만든 지도이며, 제작자는 감염에 따른 사망자 수와 주소가 포함된 데이터를 기반으로 아래의 프로세스대로 지도를 작성했다.
1) 데이터에서 첫 번째 줄에 나와있는 사망자의 주소를 지도에 표기
2) 데이터에서 두 번째 줄에 나와있는 감염자 주소를 지도에 표기
3) 상기 데이터들을 점, 사각형 등으로 표기하였으며, 사망자가 2명 이상인 경우 별도 구분함
지도 시각화를 통해 런던 콜레라 유포의 현황을 한눈에 쉽게 파악할 수 있었다. 공용 펌프가 있는 지역을 중심으로 점, 사각형 등의 표시가 밀집되어 있었다는 점을 통해 최초 콜레라 유포 지역을 추정할 수 있게 되었고, 이는 콜레라 종식의 토대가 되었다.
상기 사례는 데이터 시각화의 필요성에 대한 근거가 될 수 있다. 데이터를 시각화하면 새로운 정보를 찾아낼 수 있을 뿐 아니라, 산발적으로 흩어져있는 정보들이 가지고있는 함의를 쉽게 파악할 수 있다. 즉, 큰 그림을 볼 수 있다는 것이다.
데이터 시각화는 이제 일상생활에서 뗄 수 없는 것이며, 해가 갈수록 발전하고 있다. 이제는 모든 기업의 보고장표를 간단한 인포그래픽 등으로 표시하며, 대통령 선거 등과 관련된 지표를 언론에서 대중에게 공개할 때도 단순 정적 시각자료 뿐 아니라 동적인 흥미요소를 가미하여 데이터를 시각화 해 대중들에게 전달하고 있다. 다만, 데이터 시각화에도 맹점이 존재하는데, 데이터의 의미나 수치 자료를 구체적으로 제시하지 않고 그림만 제공할 경우 오 해석의 여지가 있다. 또한 수치를 무시하고 시각 자료를 왜곡해 전달하는 경우 실제와는 다른 내용의 정보를 수용하게 되는 경우도 있다. 따라서 데이터 시각화 작업을 하는 자는 최대한 객관적인 시선에서 작업을 해야 할 것이다.
참고 자료
없음