[R] 데이터 불러오기 : EXCEL - read_excel(), read.xlsx()
R은 SPSS나 SAS에 비해 많은 종류의 파일을 불러오고 사용하기에 적합하다. 하지만 각 파일마다 불러오는 방법이 다르며, 심지어는 한 종류의 파일을 불러오는 방법도 여러 가지다. 따라서 하나씩 살펴보고자 한다.
먼저 이번시간엔 EXCEL 파일을 불러오는 방법을 소개한다.
코드를 보여드리기에 앞서 워킹 디렉토리부터 지정하겠다.
워킹 디렉토리에 관한 설명은 다음 링크된 포스트에서 볼 수 있다.
2022.08.05 - [통계 프로그램 사용 팁] - [R] 작업 디렉토리 (Working Directory) 지정
setwd("C:/Users/user/Documents/Tistory_blog")
*실습용 데이터는 아래 링크를 클릭하면 다운로드할 수 있습니다.
2022.08.04 - [공지사항 및 소개] - 분석용 데이터 (update 22.08.04) - 기술 통계
EXCEL 불러오기
많이들 쓰는 함수는 두 가지가 있다.
read_excel() (패키지: readxl)
read.xlsx() (패키지: openxlsx)
각각의 패키지를 설치하고, 작업 디렉토리 내에 있는 파일 "Data.xlsx"를 불러와보도록 하겠다.
install.packages("readxl")
library("readxl")
read_excel("Data.xlsx")
install.packages("openxlsx")
library("openxlsx")
read.xlsx("Data.xlsx")
두 가지 방식 모두 데이터를 잘 불러오나 약간의 차이가 있다. 차이를 확인하기 위해 각각 a, b, c에 저장을 한 뒤, 속성을 볼 수 있는 str() 함수를 사용하여 확인하면 다음을 알 수 있다.
a<-read_excel("Data.xlsx")
b<-read.xlsx("Data.xlsx")
str(a)
#tibble [1,000 x 2] (S3: tbl_df/tbl/data.frame)
str(b)
#'data.frame': 1000 obs. of 2 variables:
"read_excel"은 tibble로, "read.xlsx"는 data.frame으로 읽어온다.
일반적으로 tibble을 쉽게 data.frame으로 변환할 수 있으므로 "read_excel()"함수를 더 많이 사용한다.
read_excel() 함수에도 수많은 arguments들이 있지만 꼭 필요하고, 자주 쓰일 수 있는 것 한 개만 보겠다.
read_excel("Data.xlsx", sheet="Data")
sheet="Data" : 불러올 시트 이름을 지정하는 것이다.
R 데이터 불러오기 - EXCEL 정복 완료!
작성일: 2022.08.05.
최종 수정일: 2022.11.08.
이용 프로그램: R 4.1.3, RStudio v1.4.1717
운영체제: Windows 10
'통계 프로그램 사용 방법 > R' 카테고리의 다른 글
[R] 데이터 저장하기 : EXCEL 파일 - write_xlsx(), write.xlsx() (0) | 2022.08.10 |
---|---|
[R] 데이터 불러오기 : SAS file (.sas7bdat) - read.sas7bdat(), read_sas() (0) | 2022.08.10 |
[R] 데이터 불러오기 : CSV - read_csv(), read.csv(), fread() (0) | 2022.08.08 |
[R] 패키지 설치하기 - install.packages(), library() (0) | 2022.08.05 |
[R] 작업 디렉토리 (Working Directory) 지정 - getwd(), setwd() (0) | 2022.08.05 |