소개글
자료, 수, 통계, 대표값, 분산, 중앙값, 최빈값
목차
없음
본문내용
그래프의 한계
첫째, 상대방이 네가 발견한 것이 무엇이냐고 물으면 그래프를 그려서 보여주는 수 밖에 없다.
둘째, 결과물(그래프)를 가지고 우리가 할 수 있는 일이 그리 많지 않다.
따라서, 결과물을 몇 개의 수로 표현한다면 도움이 될 것이다.
1. 중심 경향의 측정
2. 분산의 측정
표기법
15개씩 요강을 더 비운다면?
산술평균 [arithmetic mean]
구간 척도, 비율 척도의 자료에서 중심 경향을 측정하는 평균.
중앙값 [Median]
서열 척도의 자료에서 중심 경향을 나타내는 값.
중앙값은 크기순대로 나열하였을 때에 가운데에 위치하는 수이다.
예를 들어, 1, 3, 3, 4, 6, 13, 14, 14, 18의 경우 중앙값은 6이다.
변량의 개수가 짝수인 경우에는 가운데 두 수를 더해서 2로 나눠준 값이 중앙값이다.
예를 들어, 1, 3, 3, 4, 6, 13, 14, 14, 17, 18의 경우 9.5이다.
최빈값 [mode]
명목 척도의 자료에서 중심 경향을 나타내는 값.
분산의 측정
명목 척도인 자료의 분산??
걍 PASS~
범위 [RANGE]
102, 109, 110, 107, 120의 변량이 있다면 범위는 120-102=18이다.
범위는 굉장히 계산하기 간단하다는 장점이 있지만 단점도 만만치 않다.
첫째로, 특히 많은 수의 표본을 다룰 때에 그 값이 안정적이지 못하다.
둘째로는 범위의 값이 표본의 크기에 의존하고 있다는 점을 들 수 있다.
마지막으로, 우리가 범위를 가지고 그 후에 할 수 있는 일이란 게 거의 없다.
어느 여행지에 여행객이 머무는 평균 일수를 31일 이라고 할 때
범위가 10인 경우와 100인 경우를 생각해보라.
범위가 10인 경우에 비해서 100인 경우에 우리는
31일이라고 하는 중심 경향이 통계적으로
대표성이 떨어진다는 것을 즉각적으로 알아차릴 수 있다
참고 자료
현대 기초통계학, 성태제 저, 학지사, 2011