반응형

[SPSS] 일원 배치 분산 분석 (One-way ANOVA, ANalysis Of VAriance)

 

이전 포스팅에서 음주 여부에 따른 ALT 평균에 차이가 있는지를 알아보기 위해서는 T test를 사용한다는 내용을 알아보았다. 2022.11.30 - [모평균 검정/SPSS] - [SPSS] 독립 표본 T검정 (Independent samples T-test)

 음주 여부는 "1) 음주자", "2) 비음주자"로 나뉘는 이분형 변수다. 즉, 음주자의 ALT 평균과 비음주자의 ALT 평균을 비교한 것이었다. 

 

 만약, 두 개 이상의 범주로 나뉘는 변수에 대해 모평균의 검정을 하고자 한다면 어떻게 해야 할까? 예를 들어, 흡연 상태를 "1) 비흡연자", "2) 과거 흡연자", "3) 현재 흡연자"로 나누었고, 각 그룹의 폐기능 검사 중 하나인 FVC (Forced Vital Capacity)의 평균에 차이가 있는지 알아보고자 한다. 

 

 이때 사용할 수 있는 방법이 일원 배치 분산 분석인 One-way ANOVA (Analysis of Variance)이며 이번 포스팅에서 다뤄볼 주된 내용이다.

*실습용 데이터는 아래 링크를 클릭하면 다운로드할 수 있습니다.

2022.08.04 - [공지사항 및 소개] - 분석용 데이터 (update 22.11.28)

 

분석용 데이터 (update 22.11.28)

2022년 11월 28일 버전입니다. 변수는 계속하여 추가될 예정입니다. 다음 카테고리에 있는 글에서 이용된 데이터입니다. - 기술 통계 - 범주형 자료 분석 - 모평균 검정 - 반복 측정 자료 분석 - 통계

medistat.tistory.com

 

데이터를 불러오도록 한다. 불러오는 방법은 다음 링크를 확인하도록 한다.

2022.08.04 - [통계 프로그램 사용 방법/SPSS] - [SPSS] 데이터 불러오기 및 저장하기

 

목표: 흡연 상태에 따라 FVC 평균은 서로 다르다고 모집단 수준에서 말할 수 있는가?

 

전제조건 (정규성, 등분산성)

 ANOVA에는 두 가지 전제조건이 필요하다. 본 포스팅의 예시에 맞추어 설명하면 다음과 같다.

 1) 정규성: 현재 흡연자, 과거 흡연자, 비흡연자 별로 FVC의 분포를 보았을 때 각각의 분포는 정규성을 따른다. 

 2) 등분산성: 현재 흡연자, 과거 흡연자, 비흡연자 별로 FVC의 분포를 보았을 때 분산은 서로 같다.

 

따라서 각각을 검정해야 한다.

 

1) 정규성 

2022.08.11 - [기술 통계/SPSS] - [SPSS] 정규성 검정

2022.08.18 - [기술 통계/SPSS] - [SPSS] 고급 Q-Q Plot - Van der Waerden, Rankit, Tukey, Blom

 

1) 분석(A) > 기술통계량(E) > 데이터 탐색 (E)

 

2) 분석하고자 하는 변수인 FVC_pPRED을 "종속변수"에 넣어준다. 흡연 상태에 따라 분석할 것이므로 "요인(F)"에 SMOK을 넣는다. 그 뒤 "도표(T)..."를 선택한다.

 

3) "히스토그램(H)", "검정과 함께 정규성 도표(O)" 체크박스를 클릭하고 "계속(C)"를 누르고, 돌아가 "확인"을 누른다.

 

결과
1) Q-Q plot

 

2) 히스토그램

 

3) Shapiro-Wilk 검정

 표본의 수가 2,000이 되지 않으므로 Shapiro-Wilk 통계량의 p-value를 보아야 하고, 이는 0.05보다 크다. Q-Q plot, 히스토그램에서 정규성을 띠지 않는다고 할만한 근거가 없으므로 정규성을 따른다고 결론을 짓는다.

 

 따라서 정규성 전제조건은 만족한다고 할 수 있다.

 

일원 배치 분산 분석 (ANOVA) 방법

1) 분석(A) > 평균 비교 (M) > 일원배치 분산분석(O)

 

2) 분석하고자 하는 변수 FVC_pPRED를 "종속변수(E)"쪽으로 옮기고, SMOK을 "요인(F)"쪽으로 옮긴다. 그리고 "옵션"을 누른다.

 

3) "분산 동질성 검정(H)" 체크박스를 선택한다. 그리고 "계속 (C)"을 누른다.

 

4)  "사후분석(H)"을 클릭한다.

많은 사후분석 방법이 있지만 우리는 Bonferroni, Scheffe, Tukey, Duncan을 확인하도록 한다.  이 네 개를 체크한다.

 

 

결과

1) 등분산성 검정

ANOVA의 두 번째 전제조건인 등분산성에 대한 검정이다.

맨 위에 평균을 기준으로 한 검정이 일반적인 Levene의 등분산 검정이다.

그다음 중위수를 기준으로 한 검정이 Brown-Forsythe의 등분산성 검정이다.

어떤 것을 선택하는지는 개인의 선택이다. 하지만 이 경우 둘 다 0.05보다 크므로 귀무가설을 받아들여, 분산에 차이가 없다고 결론 내린다. 따라서 전제조건을 만족함을 알 수 있다.

 

2) ANOVA결과

ANOVA의 결과는 집단-간 유의 확률을 확인하면 된다. p-value<0.001으로 유의하다. 따라서 귀무가설을 기각하고 대립 가설을 선택한다. 그렇다면 여기에서 귀무가설 및 대립 가설은 무엇이었는가?

 

 귀무가설:  $H_0 =$ 세 집단의 모평균은 "모두" 동일하다.

 대립 가설:  $H_1 =$  세 집단의 모평균이 모두 동일한 것은 아니다.

 

우리는 대립 가설을 채택해야 하므로 "세 집단의 모평균이 모두 동일한 것은 아니다."라고 결론 내릴 것이다.

이 말은, 세 집단 중 두 개씩 골라 비교했을 때, 적어도 한 쌍에서는 차이가 난다는 것이다. 따라서 세 집단 중 두 개씩 골라 비교를 해보아야 하며, 이를 사후 분석 (post hoc analysis)이라고 한다. 세 집단에서 두 개씩 고르므로 가능한 경우의 수는 $_3C_2 =3$이다.

 (1) 비흡연자 vs 과거 흡연자

 (2) 비흡연자 vs 현재 흡연자

 (3) 과거 흡연자 vs 현재 흡연자

 

사후 분석 결과 부분을 보겠다.

 

1) 사후검정 1 - Tukey, Scheffe, Bonferroni

Duncan을 제외한 방법은 각 차이에 대한 보정된 p-value를 보여준다. 위 표를 보는 법은 다음과 같다.

0 1 비흡연자 (0)와 과거 흡연자 (1) 사이의 비교
2 비흡연자 (0)와 현재 흡연자 (2) 사이의 비교
1 0 비흡연자 (0)와 과거 흡연자 (1) 사이의 비교
2 과거 흡연자 (1)와 현재 흡연자 (2) 사이의 비교
2 0 비흡연자 (0)와 현재 흡연자 (2) 사이의 비교
1 과거 흡연자 (1)와 현재 흡연자 (2) 사이의 비교

어떤 방법을 사용하든, 모든 비교에서 p-value는 0.001보다 작아 매우 유의하므로 모든 비교에서 유의미한 FVC의 차이가 있다고 할 수 있다.

 

2) 사후검정 2 - Tukey, Duncan, Scheffe

Bonferroni는 동질적 부분집합으로 표현해주지 않으며, Duncan은 동질적 부분집합으로만 표현해준다. 

위 세 개 모두 같은 결과를 보여주고 있다. 해석하는 방법은 다음과 같다.

SMOK=2는 평균이 76.78562788이며, 부분집합 1에 속한다.

SMOK=1는 평균이 85.80627187이며, 부분집합 2에 속한다.

SMOK=0는 평균이 95.33911151이며, 부분집합 3에 속한다.

속한 부분집합이 다르면 평균에 유의미한 차이가 있다는 것이다. 부분집합 1, 2, 3은 서로 다른 평균을 가진 모집단에서 유래했다고 볼 수 있으므로 비흡연자, 과거 흡연자, 현재 흡연자는 서로 다른 평균을 갖고 있다고 할 수 있다. 

 

이 시점에서 이런 의문이 들 수 있다.

"각각의 그룹별로 평균을 비교하면 되지, 굳이 왜 ANOVA라는 방법까지 사용하는 것인가?"

 아주 논리적인 의문점이다. 하지만, 반드시 ANOVA를 사용해야 한다. 그 이유는 다음과 같다. 본 사례는 흡연 상태에 따른 조합 가능한 경우의 수가 3인데, 각각 유의성의 기준을 $\alpha=0.05$로 잡아보자. 이때 세 번의 비교에서 모두 귀무가설이 학문적인 진실인데(평균에 차이가 없다.), 세 번 모두 귀무가설을 선택할 확률은 $\left(1-0.05 \right)^3 \approx 0.86$이다. (이해가 어려우면 p-value에 대한 설명 글을 읽고 오길 바란다. 2022.09.05 - [통계 이론] - [이론] p-value에 관한 고찰)

 그런데, ANOVA의 귀무가설은 "모든 집단의 평균이 같다."이다. 따라서 모든 집단의 평균이 같은 것이 학문적 진실일 때, 적어도 한 번이라도 대립 가설을 선택하게 될 확률은 1−0.86=0.14가 된다. 즉, 유의성의 기준이 올라가게 되어, 덜 보수적인 결정을 내리게 되고, 다시 말하면 대립 가설을 잘 선택하는 쪽으로 편향되게 된다. 학문적으로는 '다중 검정 (multiple testing)을 시행하면 1종 오류가 발생할 확률이 증가하게 된다.'라고 표현한다.

 따라서, 각각을 비교해보는 것이 아니라 한꺼번에 비교하는 ANOVA를 시행해야 함이 마땅하다. 

 

 여기에서 한 번 더 의문이 들 수 있다.

 "사후 분석을 할 때에는 1종 오류가 발생하지 않는가?"

그렇다. 1종 오류가 발생할 확률이 있으므로, p-value의 기준을 더 엄격하게 (0.05보다 더 작게) 잡아야 한다. P-value를 보정하는 방법은 여러 가지가 나와있는데, 가장 간단하고 제일 보수적인 방법이 위에 예시에서 사용한 본페로니 방법이다. 그 외에도 굉장히 많은 방법이 있지만, Bonferroni, Duncan, Scheffe, Tukey가 가장 많이 쓰이는 듯하다. 이 중에 Duncan, Tukey는 그룹별로 표본의 수가 같을 때만 사용해야 하므로 유의하도록 한다.

 

어떤 사후 분석을 쓸 것인가

 이 논의에 대해 정답이 따로 있는 것은 아니다. 적절한 방법을 사용하여 논문에 제시하면 되고, 어떤 것이 정답이라고 콕 집어 이야기할 수는 없다. 다만, 사후 분석 방법이 여러 가지가 있다는 것은 '사후 분석 방법에 따라 산출되는 결과가 달라질 수 있다.'는 것을 의미하고, 심지어는 '어떤 사후 분석 방법을 채택하냐에 따라 유의성 여부가 달라질 수도 있다.'는 것을 의미한다. 심지어, ANOVA에서는 유의한 결과가 나왔는데, 사후 분석을 해보니 유의한 차이를 보이는 경우가 없을 수도 있다. 따라서 어떤 사후 분석 방법 결과에 따른 결과인지 유의하여 해석할 필요가 있다.

 

[SPSS] 일원 배치 분산 분석 (One-way ANOVA, ANalysis Of VAriance) 정복 완료!

 

작성일: 2022.11.30.

최종 수정일: 2022.11.30.

이용 프로그램: IBM SPSS v26

운영체제: Windows 10

반응형

+ Recent posts