데이터시각화 ) 1. 런던 콜레라지도(교재 p.4)를 조사하고 데이터 시각화의 필요성을 설명하시오. 2. 아름답고 의미 있는 데이터 시각화 사례를 발굴하고 그 이유를 정리하시오.
- 최초 등록일
- 2022.07.27
- 최종 저작일
- 2022.06
- 10페이지/ 한컴오피스
- 가격
5,000원4,750원
목차
1. 런던 콜레라지도(교재 p.4)를 조사하고 데이터 시각화의 필요성을 설명하시오.(7점)
2. 아름답고 의미 있는 데이터 시각화 사례를 발굴하고 그 이유를 정리하시오.(7점)
3. R 패키지 “vcd”에 내장된 “Arthritis” 데이터셋은 류마티스 관절염 환자를 대상으로 한 임상시험 결과 데이터이다. 각 행은 각 환자를 나타내며, 변수 Treatment는 그룹 (Treated = 새로운 치료제를 투약한 그룹, Placebo = 위약을 받은 그룹)을 나타낸다. 변수 Sex는 성별을, Improved는 치료 결과(None = 차도 없음, Some = 약간 좋아짐, Marked = 매우 좋아짐)를 나타낸다. 새로운 치료제 투약 여부가 치료 결과와 연관이 있는지, 성별과 치료 결과 간에 연관이 있는지를 데이터 시각화를 통해서 탐구하시오. (18점)
4. R에 내장된 “airquality” 데이터셋은 1973년 5월부터 9월까지 뉴욕의 대기질에 관한 데이터셋이다. 변수 Ozone은 대기 중 오존의 양, Solar.R은 태양방사선의 양, Wind는 풍속, Temp는 기온을 나타낸다. 이 네가지 변수(Ozone, Solar.R, Wind, Temp)에 대한 산점도 행렬을 그리고, 이 산점도 행렬에서 알 수 있는 변수들 간의 관계에 대하여 서술하시오. (18점)
5. 참고자료
본문내용
1. 런던 콜레라지도(교재 p.4)를 조사하고 데이터 시각화의 필요성을 설명하시오.(7점)
해당 콜레라 지도는 지도에 사망자의 수만큼 막대 선을 그려 넣은 모양이다. 당시 나쁜 공기로 전염되는 줄만 알았던 콜레라의 사망자 수를 시각화하여 표현한 지도를 분석한 결과 유독 브로드 가의 중앙에 막대 선들이 집중되는 경향을 볼 수 있었고, 브로드 가 중앙 근처에는 우물 펌프가 있었다는 사실이 밝혀졌다. 콜레라균이 우물을 감염시켜 감염된 물을 길어 마신 주민들이 콜레라에 걸려 사망했던 사실까지 자연히 밝혀지게 되었다. 결국 우물은 폐쇄되었고, 이후 콜레라는 확산되지 않았다.
단순하게 표현된 콜레라지도는 콜레라 균의 확산을 막는 데에 큰 구실을 했다. 만약 복잡한 데이터 수치로만 사망자 수를 판단했더라면 더욱 큰 확산으로 이어졌을지도 모른다. 시각화 없이 누적된 인원수를 파악하는 데 걸리는 시간보다는 한눈에 확인할 수 있는 시각적인 정보로 사항을 이해하고 판단하는 것에 훨씬 적은 시간을 소모하는 까닭이다.
데이터 시각화는 한 눈에 알아보기 어려운 수많은 정보들, 데이터를 목적에 맞게 연속적, 혹은 이해하기 쉽게 알아보는 데 필요한 과정이다. 세상에는 수많은 데이터가 존재하고 해당 데이터에 대한 전문지식이 있는 사람과, 없는 사람이 다양하게 뒤섞여 존재한다. 이는 비단 전문가의 분석 때문만이 아니더라도 해당 분야에 저명하지 않은 다른 일반인들의 시선이나 집중을 한 번에 끌어당길 수 있는 것이 바로 시각적인 데이터다. 정보를 명확하고 효과적으로, 쉽게 전달하는 데에는 데이터 시각화가 필수불가결하다.
더불어 데이터 시각화는 여러 활용의 기반이 된다. 사람을 설득하는 데에 가장 큰 무기는 데이터이고, 사실이다. 데이터 시각화를 통해 분석한 자료들은 의미 있는 통찰로 이어지고, 의미 있는 통찰로 이어진 헤아릴 수 없는 많은 사실은 또 다른 지식의 원천이 된다.
참고 자료
강의자료 참조
아름다운 데이터 사례
http://geonet.oii.ox.ac.uk/blog/the-world-online/
George Arnett, “World wide web? Map resizes countries by number of internet users”, 2015.07.10, https://www.theguardian.com/news/datablog/2015/jul/10/world-map-web-users-oxford-internet-institute