반응형

[SPSS] 피셔 정확 검정

 

 범주형 변수의 분포 사이에 유의미한 차이가 있는지 확인하는 분석으로는 보통 카이 제곱 검정을 시행한다. SPSS을 이용한 카이 제곱 검정 시행법은 다음 링크에서 확인할 수 있다.

2022.09.06 - [범주형 자료 분석/SPSS] - [SPSS] 카이 제곱 검정 (일반 및 연속성 수정)

 

그런데 기대 빈도가 5를 넘지 않는 셀이 전체의 25% 이상인 경우 카이 제곱 검정의 결과는 신뢰도가 떨어져 쓸 수 없게 되고 피셔 정확 검정 (Fisher's exact test)을 사용해야 한다. 이에 대한 이론적인 내용은 다음 링크에서 확인할 수 있다.

피셔 정확 검정: 2022.08.26 - [통계 이론] - [이론] 피셔 정확 검정 (Fisher's exact test)

피셔 정확 검정과 카이 제곱 검정의 관계:2022.08.29 - [통계 이론] - [이론] 카이 제곱 검정과 피셔 정확 검정의 관계

 

본 포스팅에서는 피셔 정확 검정을 어떻게 시행하는지 설명하고자 한다.

 

성별과 RH혈액형 간의 관계가 다음과 같다고 하자. RH혈액형의 분포를 보니 RH- 6명 중 5명이 무려 남성에 치우쳐져 있다. 이 결과를 보고 "남성일수록 RH-일 경향성이 있다."라고 할 수 있는지 따지는 검정이 피셔 정확 검정이다. 

  RH- RH+
여성 1 481
남성 5 513

 

일반적으로 이런 경우 카이 제곱 검정을 사용하지만 이 경우 사용할 수 없다. 기대 빈도가 5를 넘지 않는 셀이 전체의 25% 이상이기 때문인데, 한번 확인해보도록 하자.

 

*실습용 데이터는 아래 링크를 클릭하면 다운로드할 수 있습니다.

2022.08.04 - [공지사항 및 소개] - 분석용 데이터 (update 22.08.29)

 

분석용 데이터 (update 22.08.29)

2022년 08월 29일 버전입니다. 변수는 계속하여 추가될 예정입니다. 다음 카테고리에 있는 글에서 이용된 데이터입니다. - 기술 통계 - 통계 프로그램 사용 방법 1) 엑셀 파일 2) CSV 파일 3) 코드북

medistat.tistory.com

 

피셔 정확 검정 시행하기

 

2*2 분할표

1) 분석(A) > 기술통계량(E) > 교차분석(C) 

 

2) 행과 열에 원하는 변수를 넣어주기. 여기에서는 행에 SEX를, 열에 RH을 넣었다. 그리고 통계량(S)를 클릭한다.

3) 카이제곱(H)의 체크박스를 선택한다. "계속(C)"버튼을 누른다.

 

 4) 셀(E)을 클릭한다.

5) 기대빈도 (E) 체크박스를 선택하고 "계속(C)"를 누른다.

6) "확인" 버튼을 눌러 결과를 확인한다.

결과

1) 기대빈도

 기대 빈도가 5 미만인 셀이 2개 (50%)이므로 카이 제곱 검정이 아닌 피셔 정확 검정 (Fisher's exact test)을 시행해야 한다.

 또한,  "2 셀 (50.0%)은(는) 5보다 작은 기대 빈도를 가지는 셀입니다."이라고 말하며 카이 제곱 검정이 아닌 피셔 정확 검정을 시행해야 한다고 경고하고 있다. 

 

2) 피셔 정확 검정 결과

 피셔 정확 검정의 결과를 볼 때에는 정확 유의확률 (양측검정)의 결과를 보는 것이 일반적이다. 유의성 기준을 0.05로 잡았을 때, 성별과 RH 혈액형 여부는 독립이 아니라고 할 수 없다. 따라서 성별과 RH 혈액형 사이에는 어떠한 관계가 있다고 볼 수 없다. 양측 검정이 아닌 단측 검정을 보아야 할 때도 있다. 이는 대립 가설이 어떤 것이냐에 따라 달라지는데 이에 대한 자세한 내용은 다음 포스팅에서 확인할 수 있다.

2022.08.26 - [통계 이론] - [이론] 피셔 정확 검정 (Fisher's exact test)

 

 

2*2 이상의 분할표

분할표가 2*2 이상인 경우 정확 검정을 자동으로 시행해주지 않는다. 따라서 정확 검정을 하겠다는 설정을 따로 해주어야 한다.

 

 

1) 분석(A) > 기술통계량(E) > 교차분석(C) 

 

2) 행과 열에 원하는 변수를 넣어주기. 여기에서는 행에 SEX를, 열에 TWIN을 넣었다. 그리고 정확(X)을 클릭한다.

 

3) "정확검정(E)"  버튼을 클릭한다.

4) 통계량(S)를 클릭한다.

5) 카이제곱(H)의 체크박스를 선택한다. "계속(C)"버튼을 누른다.

 

 6) 셀(E)을 클릭한다.

5) 기대빈도 (E) 체크박스를 선택하고 "계속(C)"를 누른다.

6) "확인" 버튼을 눌러 결과를 확인한다.

결과

1) 기대빈도

 기대 빈도가 5 미만인 셀이 4개 (66.7%)이므로 카이 제곱 검정이 아닌 피셔 정확 검정 (Fisher's exact test)을 시행해야 한다.

 또한,  "4 셀 (66.7%)은(는) 5보다 작은 기대 빈도를 가지는 셀입니다."이라고 말하며 카이 제곱 검정이 아닌 피셔 정확 검정을 시행해야 한다고 경고하고 있다. 

 

2) 피셔 정확 검정 결과

 피셔 정확 검정의 결과를 볼 때에는 정확 유의확률 (양측검정)의 결과를 확인한다. 유의성 기준을 0.05로 잡았을 때, 성별과 쌍둥이 여부는 독립이 아니라고 할 수 없다. 따라서 성별과 쌍둥이 여부 사이에는 어떠한 관계가 있다고 볼 수 없다.

 

 

 

카이 제곱 검정과 피셔 정확 검정의 관계

2022.08.29 - [통계 이론] - [이론] 카이 제곱 검정과 피셔 정확 검정의 관계

 

[이론] 카이 제곱 검정과 피셔 정확 검정의 관계

[이론] 카이 제곱 검정과 피셔 정확 검정의 관계  범주형 자료 분석을 할 때 "기대 빈도가 5 미만인 셀이 25% 이상인 경우 카이 제곱 검정을 신뢰할 수 없으며 피셔 정확 검정의 결과를 확인

medistat.tistory.com

 

SPSS 피셔 정확 검정 정복 완료!

 

작성일: 2022.09.20.

최종 수정일: 2022.09.20.

이용 프로그램: IBM SPSS v26

운영체제: Windows 10

 

 

반응형
반응형

 

[SPSS] 카이 제곱 검정 (일반 및 연속성 수정)

 

 카이 제곱 검정은 범주형 변수 간에 분포의 유의미한 차이가 있는지 확인하는 방법이다. 이해할 수 있는 언어로 표현하면 다음과 같다. 분할표를 작성하였을 때 다음과 같다고 하자. (출처 및 분할표 작성법:2022.09.06 - [기술 통계/SPSS] - [R] 도수분포표 (Frequency table), 분할표 (Contingency table) 만들기)

 

  비음주자 음주자
여성 236 246
남성 174 344

 

이를 보면 비음주자 중에는 여성이 많고, 음주자 중에는 남성이 많다. 그렇다면 "성별과 음주 여부는 무관하다(=독립이다)."라는 말이 틀리다고 할 수 있을까? 즉, "특정 성별은 음주자일 확률이 더 높다."라고 할 수 있을까? 이에 대한 검정이 바로 카이 제곱 검정이다.

 

*실습용 데이터는 아래 링크를 클릭하면 다운로드할 수 있습니다.

2022.08.04 - [공지사항 및 소개] - 분석용 데이터 (update 22.08.29)

 

분석용 데이터 (update 22.08.29)

2022년 08월 29일 버전입니다. 변수는 계속하여 추가될 예정입니다. 다음 카테고리에 있는 글에서 이용된 데이터입니다. - 기술 통계 - 통계 프로그램 사용 방법 1) 엑셀 파일 2) CSV 파일 3) 코드북

medistat.tistory.com

 

카이 제곱 검정 시행하기

1) 분석(A) > 기술통계량(E) > 교차분석(C) 

 

2) 행과 열에 원하는 변수를 넣어주기. 여기에서는 행에 SEX를, 열에 ALCOHOL을 넣었다. 그리고 통계량(S)를 클릭한다.

 

 3) 카이제곱(H)의 체크박스를 선택한다. "계속(C)"버튼을 누른다.

 

 

 4) 셀(E)을 클릭한다.

 

4) 기대빈도 (E) 체크박스를 선택하고 "계속(C)"를 누른다.

5) "확인" 버튼을 눌러 결과를 확인한다.

결과

1) 기대빈도

 카이 제곱 검정을 시행하기 위한 전제조건은 기대 빈도가 5 미만이 셀이 전체 셀 중 25% 미만이어야 한다는 것이므로 기대 빈도를 산출해 보았고 모두 5 이상이므로 문제가 없었다.

 또한,  "0 셀 (0.0%)은(는) 5보다 작은 기대 빈도를 가지는 셀입니다."이라고 말하며 카이 제곱 검정을 시행해도 된다고 안심시켜주고 있다. 

 

2) 카이 제곱 검정 결과

 카이 제곱 검정의 결과를 볼 때에는 첫 번째 행 "Pearson 카이제곱"의 세 번째 열 "근사 유의확률 (양측검정)"을 확인해야 한다. "0.000"이라고 쓰여있는 것은 "<0.001"을 의미한다. 따라서 유의성 기준을 0.05로 잡았을 때, 성별과 음주 여부는 독립이 아니라고 할 수 있으며, 데이터를 보면 남성이 음주할 확률이 더 높다고 할 수 있다.

 

3) 연속성 수정 카이 제곱 검정 결과 (Chi-squared test with Yates's correction for continuity)

 연속성 수정을 하고 싶은 경우 두 번째 행 "연속성 수정"의 세 번째 열 "근사 유의확률 (양측검정)"을 확인해야 한다. p-value는 0.001보다 작으므로 유의성 기준을 0.05로 잡았을 때, 성별과 음주 여부는 독립이 아니라고 할 수 있으며, 데이터를 보면 남성이 음주할 확률이 더 높다고 할 수 있다.

 - 연속성 수정에 관한 이론적인 토대는 다음 글에서 살펴볼 수 있다.

2022.08.30 - [통계 이론] - [이론] 연속성을 수정한 카이 제곱 검정 (Chi-squared test with Yates's correction for continuity)

 

[이론] 연속성을 수정한 카이 제곱 검정 (Chi-squared test with Yates's correction for continuity)

[이론] 연속성을 수정한 카이 제곱 검정 (Chi-squared test with Yates's correction for continuity) 이 글을 읽기 전에 이전 포스팅을 읽고 오길 권한다. 2022.08.29 - [통계 이론] - [이론] 카이..

medistat.tistory.com

 

카이 제곱 검정의 이론 살펴보기

2022.08.16 - [통계 이론] - [이론] 카이 제곱 검정 (Chi-squared test)

 

[이론] 카이 제곱 검정 (Chi-squared test)

[이론] 카이 제곱 검정 (Chi-squared test)  범주형 자료의 분포에 유의미한 차이가 있는지 검정하기 위해 카이 제곱 검정 (Chi-squared test)를 시행하곤 한다. 깊은 이야기를 하기 전에 이번 글에서는

medistat.tistory.com

 

 

 

SPSS 카이 제곱 검정 정복 완료!

 

작성일: 2022.09.06.

최종 수정일: 2022.09.06.

이용 프로그램: IBM SPSS v26

운영체제: Windows 10

반응형

'범주형 자료 분석 > SPSS' 카테고리의 다른 글

[SPSS] 피셔 정확 검정  (0) 2022.09.20

+ Recent posts