반응형

[R] 데이터 불러오기 : EXCEL - read_excel(), read.xlsx()

R은 SPSS나 SAS에 비해 많은 종류의 파일을 불러오고 사용하기에 적합하다. 하지만 각 파일마다 불러오는 방법이 다르며, 심지어는 한 종류의 파일을 불러오는 방법도 여러 가지다. 따라서 하나씩 살펴보고자 한다.

 

먼저 이번시간엔 EXCEL 파일을 불러오는 방법을 소개한다.

 

코드를 보여드리기에 앞서 워킹 디렉토리부터 지정하겠다.

워킹 디렉토리에 관한 설명은 다음 링크된 포스트에서 볼 수 있다.

2022.08.05 - [통계 프로그램 사용 팁] - [R] 작업 디렉토리 (Working Directory) 지정

 

[R] 작업 디렉토리 (Working Directory) 지정

[R] 작업 디렉토리 (Working directory) 지정  R에는 작업 디렉토리 (Working directory)라는 개념이 있다. SPSS에는 없는 개념이고, SAS의 라이브러리와는 약간 다른 개념인데, R의 작업 디렉토리는 일의 편리.

medistat.tistory.com

 

setwd("C:/Users/user/Documents/Tistory_blog")

 

*실습용 데이터는 아래 링크를 클릭하면 다운로드할 수 있습니다.

2022.08.04 - [공지사항 및 소개] - 분석용 데이터 (update 22.08.04) - 기술 통계

 

분석용 데이터 (update 22.08.04) - 기술 통계

2022년 08월 04일 버전입니다. 변수는 계속하여 추가될 예정입니다. 다음 카테고리에 있는 글에서 이용된 데이터입니다. - 기술 통계

medistat.tistory.com

 

EXCEL 불러오기

많이들 쓰는 함수는 두 가지가 있다.

read_excel() (패키지: readxl)
read.xlsx() (패키지: openxlsx)

각각의 패키지를 설치하고, 작업 디렉토리 내에 있는 파일 "Data.xlsx"를 불러와보도록 하겠다.

 

install.packages("readxl")
library("readxl")
read_excel("Data.xlsx")

install.packages("openxlsx")
library("openxlsx")
read.xlsx("Data.xlsx")

 

두 가지 방식 모두 데이터를 잘 불러오나 약간의 차이가 있다. 차이를 확인하기 위해 각각 a, b, c에 저장을 한 뒤, 속성을 볼 수 있는 str() 함수를 사용하여 확인하면 다음을 알 수 있다.

 

a<-read_excel("Data.xlsx")
b<-read.xlsx("Data.xlsx")

str(a)
 #tibble [1,000 x 2] (S3: tbl_df/tbl/data.frame)
str(b)
 #'data.frame':	1000 obs. of  2 variables:

"read_excel"은 tibble로, "read.xlsx"는 data.frame으로 읽어온다.

 

일반적으로 tibble을 쉽게 data.frame으로 변환할 수 있으므로 "read_excel()"함수를 더 많이 사용한다.

 

 

read_excel() 함수에도 수많은 arguments들이 있지만 꼭 필요하고, 자주 쓰일 수 있는 것 한 개만 보겠다.

read_excel("Data.xlsx", sheet="Data")

sheet="Data" : 불러올 시트 이름을 지정하는 것이다. 

 

 

R 데이터 불러오기 - EXCEL 정복 완료!

 

작성일: 2022.08.05.

최종 수정일: 2022.11.08.

이용 프로그램: R 4.1.3, RStudio v1.4.1717

운영체제: Windows 10

 
반응형

+ Recent posts