본문 바로가기

Database/Statistics

[통계] 카이제곱 검정 + Python

카이제곱 검정

  • 두 범주형 변수가 독립적이라는 귀무가설을 검정
  • 데이터가 예상한 대로인지 여부에 대한 가설 검정에 사용
  • 집단간의 동질성 여부를 통계적으로 검증하거나 두 변인간의 상관성을 통계적으로 검증하고자 할 때 사용
  • 주로 범주형 자료의 두 변인간의 상관성을 검증할 때 많이 사용
  • 범주형 자료로 구성된 데이터 분석에 이용
  • 항상 '~같다', '~없다', '0이다'가 귀무가설
  • 데이터가 적으면 p-value가 부정확할 수 있음
expected, observed, stats = pg.chi2_independence(x='변수', y='변수', data=safety)
# stats를 확인했을 때 p-value가 적을 때만 유의한 관계이다

예시

연령대에 따라 선호하는 영화 장르의 차이가 있는가?

  • 귀무가설 : 연령대에 따라 선호하는 영화 장르의 차이가 없다
  • 대립가설 : 연령대에 따라 선호하는 영화 장르와 연관성이 있다

참고

 

카이제곱 검정을 위한 카이제곱분포 가정과 공식 : 범주형 자료

안녕하세요 여러분 논문컨설팅 · 통계분석 · 리서치 전문 드림셀파입니다. 오늘의 매일 5분 통계분석의 주...

blog.naver.com

 

07. 카이제곱 검정: 월마트 영수증 분석

[BY 더굿북] 카이제곱 검정(Chi-squared analysis)은 칼 피어슨(Karl Pearson)이 정리한 교차분석 기법 ...

m.post.naver.com

 

연령별 선호하는 노트북 브랜드는 어디일까? 교차분석을 이용한 검증_ 통계분석을 통해 퀵데이

I사는 연령별 선호하는 노트북 브랜드를 알아보고 신규 제품개발에 반영하기 위하여 연령별 선호하는 노트...

blog.naver.com

 

반응형