용어 정리
모집단 : 조사하고자 하는 대상 집단 전체
원소 : 모집단을 구성하는 개체
표본 : 일부의 원소들
모수 : 모집단에 대한 정보
확률 : 특정 사건이 일어날 가능성의 척도
표본공간 : 나타날 수 있는 모든 결과들의 집합
원소 : 개개의 결과
사건 : 표본공간의 부분집합
확률변수 : 특정값이 나타날 가능성이 확률적으로 주어지는 변수
정의역 : x 값
공역 : y 값
치역 : 정의역(x 값)에 어떤 수를 넣었을때 실제 나오는 y 값, 치역은 공역의 부분집합
확률표본 : 특정한 확률분포로부터 독립적으로 반복해 표본을 추출하는 것, 독립적, 동일한 분포
표본 추출 방법
단순랜덤추출 : 랜덤으로 추출
계통추출방법 : 번호를 부여하고 K 번 째 마다 추출
집락추출방법 : 몇 개의 그룹이 결합된 형태로 원소들에게 일련번호를 부여 할 수 있는 경우 그룹을 랜덤으로 선택하고 각 그룹에서 표본을 추출
층화추출방법 : 이질적인 몇 개의 집단으로 나누고 집단에서 대표할 수 있도록 표본 추출
측정방법
명목척도 : 어느 집단에 속하는지 분류 남/여 출생지 등
순서척도 : 서열관계를 관측하는 척도 서비스의 선호도 (좋음, 보통, 싫음)
구간척도 : 속성의 양을 측정 온도, 지수
비율척도 : 절대적 기준인 0 값이 존재하고 모든 사칙연산이 가능 제일 많은 정보를 가지고 있는 척도 무게, 나이, 연간소득
기술 통계의 종류
숫자 : 평균, 표준편자, 중위수, 최빈값 등
그림 : 막대그래프, 원그래프, 꺽은선그래프 등
확률분포는 평균, 분산 등의 모수를 갖는다.
확률포본 (random sample) 에 의해 미지의 모수를 추정 한다.
점추정 : 모수가 특정 값일 것이다.
구간추정 : 모수가 특정 구간에 있을 것이다.
가설검정 : 모집단에 대한 어떤 가설을 설정한 뒤에 표본관찰을 통해 그 가설의 채택 여부를 결정하는 분석방법
귀무가설, 대립가설
귀무가설 : 새로운 주장 이전의 것, 일반적인 사실로 받아 지는 내용
대립가설 : 새롭게 주장 하고자 하는 내용
예 ) 60g 짜리 감자 과자의 실제 중량이 60g 일까? 확인해 보자
귀무가설 : 60g 또는 이상일 것이다.
대립가설 : 60g 미만일 것이다.
새롭게 주장하고자 하는 내용이 대립가설, 귀무가설과는 겹칠 수 없다.
p-value
이해하기 좋은 자료가 있어 긁어 왔습니다.
http://www.statedu.com/term/7341
결론은 p-value 가 작을 수록 귀무가설이 틀리고 대립가설이 (새로 주장하고자 하는 가설이) 맞다.
검정통계량 : 검정에 사용되는 통계량
모수의 검정
모수적방법 : 검정하고자 하는 모집단의 분포에 대한 가정을 하고 그 가정하에서 검정통계량과 검정통계량의 분포를 유도해 검정을 실시
비모수적방법 : 자료가 추출된 모집단의 분포에 대한 아무 제약을 가하지 않고 검정을 실시하는 방법, 관측된 자료가 특정분포를 따른다고 가정할 수 없는 경우 이용
'데이터분석' 카테고리의 다른 글
[수학] 선형대수 1장 벡터ㆍ행렬ㆍ행렬식 (0) | 2017.07.07 |
---|---|
2017.05.01 Head First Data Analysis (0) | 2017.05.01 |
[수학] 통계학입문 (두번째) (0) | 2016.06.04 |
[수학] 통계학입문 (첫번째) (0) | 2016.05.02 |
[수학] 확률 기초 이론 (0) | 2015.11.22 |