본문 바로가기
데이터분석

[수학] 통계 기초 이론

by 101Architect 2015. 11. 22.





용어 정리

모집단 : 조사하고자 하는 대상 집단 전체

원소 : 모집단을 구성하는 개체

표본 : 일부의 원소들

모수 : 모집단에 대한 정보

확률 : 특정 사건이 일어날 가능성의 척도

표본공간 : 나타날 수 있는 모든 결과들의 집합

원소 : 개개의 결과

사건 : 표본공간의 부분집합 

확률변수 : 특정값이 나타날 가능성이 확률적으로 주어지는 변수

정의역 : x 값

공역 : y 값

치역 : 정의역(x 값)에 어떤 수를 넣었을때 실제 나오는 y 값, 치역은 공역의 부분집합

확률표본 : 특정한 확률분포로부터 독립적으로 반복해 표본을 추출하는 것, 독립적, 동일한 분포


표본 추출 방법

단순랜덤추출 : 랜덤으로 추출

계통추출방법 : 번호를 부여하고 K 번 째 마다 추출

집락추출방법 : 몇 개의 그룹이 결합된 형태로 원소들에게 일련번호를 부여 할 수 있는 경우 그룹을 랜덤으로 선택하고 각 그룹에서 표본을 추출

층화추출방법 : 이질적인 몇 개의 집단으로 나누고 집단에서 대표할 수 있도록 표본 추출


측정방법

명목척도 : 어느 집단에 속하는지 분류 남/여 출생지 등

순서척도 : 서열관계를 관측하는 척도 서비스의 선호도 (좋음, 보통, 싫음)

구간척도 : 속성의 양을 측정 온도, 지수

비율척도 : 절대적 기준인 0 값이 존재하고 모든 사칙연산이 가능 제일 많은 정보를 가지고 있는 척도 무게, 나이, 연간소득


기술 통계의 종류

숫자 : 평균, 표준편자, 중위수, 최빈값 등

그림 : 막대그래프, 원그래프, 꺽은선그래프 등


확률분포는 평균, 분산 등의 모수를 갖는다.

확률포본 (random sample) 에 의해 미지의 모수를 추정 한다. 

점추정 : 모수가 특정 값일 것이다.

구간추정 : 모수가 특정 구간에 있을 것이다.


가설검정 : 모집단에 대한 어떤 가설을 설정한 뒤에 표본관찰을 통해 그 가설의 채택 여부를 결정하는 분석방법

귀무가설, 대립가설

귀무가설 :  새로운 주장 이전의 것, 일반적인 사실로 받아 지는 내용

대립가설 : 새롭게 주장 하고자 하는 내용 

예 )  60g 짜리 감자 과자의 실제 중량이 60g 일까? 확인해 보자

귀무가설 : 60g 또는 이상일 것이다.

대립가설 : 60g 미만일 것이다.

새롭게 주장하고자 하는 내용이 대립가설, 귀무가설과는 겹칠 수 없다. 

p-value

이해하기 좋은 자료가 있어 긁어 왔습니다.

http://www.statedu.com/term/7341

결론은 p-value 가 작을 수록 귀무가설이 틀리고 대립가설이 (새로 주장하고자 하는 가설이) 맞다.  


검정통계량 : 검정에 사용되는 통계량


모수의 검정 

모수적방법 : 검정하고자 하는 모집단의 분포에 대한 가정을 하고 그 가정하에서 검정통계량과 검정통계량의 분포를 유도해 검정을 실시

비모수적방법 : 자료가 추출된 모집단의 분포에 대한 아무 제약을 가하지 않고 검정을 실시하는 방법, 관측된 자료가 특정분포를 따른다고 가정할 수 없는 경우 이용





반응형