카이제곱 검정
- 두 범주형 변수가 독립적이라는 귀무가설을 검정
- 데이터가 예상한 대로인지 여부에 대한 가설 검정에 사용
- 집단간의 동질성 여부를 통계적으로 검증하거나 두 변인간의 상관성을 통계적으로 검증하고자 할 때 사용
- 주로 범주형 자료의 두 변인간의 상관성을 검증할 때 많이 사용
- 범주형 자료로 구성된 데이터 분석에 이용
- 항상 '~같다', '~없다', '0이다'가 귀무가설
- 데이터가 적으면 p-value가 부정확할 수 있음
expected, observed, stats = pg.chi2_independence(x='변수', y='변수', data=safety)
# stats를 확인했을 때 p-value가 적을 때만 유의한 관계이다
예시
연령대에 따라 선호하는 영화 장르의 차이가 있는가?
- 귀무가설 : 연령대에 따라 선호하는 영화 장르의 차이가 없다
- 대립가설 : 연령대에 따라 선호하는 영화 장르와 연관성이 있다
참고
카이제곱 검정을 위한 카이제곱분포 가정과 공식 : 범주형 자료
안녕하세요 여러분 논문컨설팅 · 통계분석 · 리서치 전문 드림셀파입니다. 오늘의 매일 5분 통계분석의 주...
blog.naver.com
07. 카이제곱 검정: 월마트 영수증 분석
[BY 더굿북] 카이제곱 검정(Chi-squared analysis)은 칼 피어슨(Karl Pearson)이 정리한 교차분석 기법 ...
m.post.naver.com
연령별 선호하는 노트북 브랜드는 어디일까? 교차분석을 이용한 검증_ 통계분석을 통해 퀵데이
I사는 연령별 선호하는 노트북 브랜드를 알아보고 신규 제품개발에 반영하기 위하여 연령별 선호하는 노트...
blog.naver.com
반응형
'Database > Statistics' 카테고리의 다른 글
[통계] 로지스틱 회귀분석(Logistic Regression) (0) | 2021.09.05 |
---|---|
[통계] 로그 함수 + Python (0) | 2021.09.04 |
[통계] 회귀분석(회귀계수, R제곱, 더미코딩) + Python (0) | 2021.09.04 |
[통계] 상관분석 + Python (0) | 2021.09.04 |
[통계] 분산 분석(등분산성, 사후 검정) + Python (0) | 2021.09.04 |