[R] 정규성 검정 (1) : Q-Q plot - qqnorm(), qqline()
많은 통계 분석에서 전제조건으로 데이터의 정규성(normality)을 요구하곤 한다. 검정하는 여러 방법이 다음과 같이 존재하지만, 그중 어떤 하나만으로도 결론 내릴 수는 없다.
정규성 검정 방법
1) Q-Q plot
2) 히스토그램: 2022.08.11 - [기술 통계/R] - [R] 정규성 검정 (2) : 히스토그램 - hist(), dnorm()
본 글에서는 Q-Q plot으로 검정하는 방법에 대해 확인해볼 것이다.
코드를 보여드리기에 앞서 워킹 디렉토리부터 지정하겠다.
워킹 디렉토리에 관한 설명은 다음 링크된 포스트에서 볼 수 있다.
2022.08.05 - [통계 프로그램 사용 방법/R] - [R] 작업 디렉토리 (Working Directory) 지정 - getwd(), setwd()
setwd("C:/Users/user/Documents/Tistory_blog")
*실습용 데이터는 아래 링크를 클릭하면 다운로드할 수 있습니다.
2022.08.04 - [공지사항 및 소개] - 분석용 데이터 (update 22.08.10)
데이터를 불러와 a에 객체로 저장하겠다.
데이터 불러오는 방법은 다음 링크에서 볼 수 있다.
2022.08.05 - [통계 프로그램 사용 방법/R] - [R] 데이터 불러오기 : EXCEL - read_excel(), read.xlsx()
2022.08.08 - [통계 프로그램 사용 방법/R] - [R] 데이터 불러오기 : CSV - read_csv(), read.csv(), fread()
2022.08.10 - [통계 프로그램 사용 방법/R] - [R] 데이터 불러오기 : SAS file (.sas7bdat) - read.sas7bdat(), read_sas()
install.packages("readr")
library("readr")
a<-read_csv("Data.csv")
a라는 객체에 있는 데이터 중 "ALT"의 Q-Q plot을 그려볼 것이다. 코드는 다음과 같다.
# install.packages("stats")
#stats 패키지는 R 설치 시 함께 딸려오므로 설치 필요 없음
# library("stats)
qqnorm(a$ALT)
qqline(a$ALT)
qqnorm(a$ALT): "a"라는 객체의 "ALT열"에 있는 데이터로 Q-Q plot을 그리시오.
qqline(a$ALT): 추세선을 그리시오.
결과
해석방법
데이터가 직선상에 있음: 정규성 따름
데이터가 직선에서 벗어나 있음: 정규성 따르지 않음
따라서, "대부분의 데이터들이 일직선 상에 있으므로 정규성을 따른다고 할 수 있다."
Q-Q plot 이론은 다음 링크에서 확인할 수 있다.
2022.08.12 - [통계 이론] - [이론] Q-Q Plot (Quantile-Quantile Plot)
R 정규성 검정 (Q-Q plot) 정복 완료!
작성일: 2022.08.11.
최종 수정일: 2022.08.31.
이용 프로그램: R 4.1.3, RStudio v1.4.1717
운영체제: Windows 10