반응형

[SPSS] 변수 계산 (산술 연산)

주어진 데이터의 값을 바꾸어 사용해야 할 때가 있다. 이번 포스팅에서는 다음의 연산들을 소개할 것이다.

 

산술 연산

1) 더하기

2) 빼기

3) 곱하기

4) 나누기

5) 제곱 (승)

6) 로그 (log)

7) 지수

 

*실습용 데이터는 아래 링크를 클릭하면 다운로드할 수 있습니다.

2022.08.04 - [공지사항 및 소개] - 분석용 데이터 (update 22.11.28)

 

분석용 데이터 (update 22.11.28)

2022년 11월 28일 버전입니다. 변수는 계속하여 추가될 예정입니다. 다음 카테고리에 있는 글에서 이용된 데이터입니다. - 기술 통계 - 범주형 자료 분석 - 모평균 검정 - 반복 측정 자료 분석 - 통계

medistat.tistory.com

 

데이터를 불러오도록 한다. 불러오는 방법은 다음 링크를 확인하도록 한다.

2022.08.04 - [통계 프로그램 사용 방법/SPSS] - [SPSS] 데이터 불러오기 및 저장하기

 

산술 연산을 시작하겠다.

 

변환(T) > 변수 계산(C)

 

1) 더하기

LIVER_SUM=AST+ALT : AST와 ALT값을 합쳐 LIVER_SUM이라는 변수에 저장하라.

 

2) 빼기

ALT_DIF=ALT-ALT_POSTMED : ALT에서 ALT_POSTMED를 빼서 그 값을 ALT_DIF라는 변수에 저장해라.

 

3) 곱하기

MALE_ALC=SEX*ALCOHOL : SEX와 ALCOHOL을 곱해 MALE_ALC라는 변수에 저장해라.

 

4) 나누기

LIVER_RATIO=AST/ALT; : AST를 ALT로 나누어 그 값을 LIVER_RAIO라는 변수에 저장해라

 

5) 거듭제곱 (승)

SBP_SQ=SBP**2;: SPB를 제곱하여 SBP_SQ에 저장해라. 만약 세제곱을 원한다면 "SBP**3"을 사용하면 된다.

 

6) 로그(log)

LOG_ALT=LN(ALT) : ALT에 로그를 씌워 LOG_ALT에 저장해라. 이때 로그의 밑은 $e$다.

그런데, LN과 같은 함수들을 모두 외우고 다니는 것은 비현실적이다. 이럴 때에는 "함수 집단(G)"을 클릭하면 "함수 및 특성변수(F)"에 여러 함수들이 나오게 되고 그중 하나를 클릭하면 함수 설명에 대한 글과 함께 바로 사용할 수 있게 해 주니 이를 사용하면 된다.

 

7) 지수

EXP_ALT=EXP(ALT); : $e$의 ALT승$\left( e^{ALT} \right)$을 EXP_ALT에 저장해라.

이 함수도 잘 모르겠으면 "함수 집단(G)"을 이용하면 편하게 할 수 있다.

 

 

 

연산 시 결측치는 어떻게 처리되는가?

연산 시 결측치는 어떻게 처리될까? AST가 결측치인 사람의 ALT값은 존재했다면, AST와 ALT를 더한 LIVER_SUM변수의 값은 어떻게 될까? 다음과 같이 결측치의 개수를 확인해보자. (결측치 확인 방법은 다음 링크를 확인하길 바란다. 2022.09.29 - [기술 통계/SPSS] - [SPSS] 기술 통계 (평균, 표준편차, 표준오차, 최댓값, 최솟값, 중위수, 분위수 등))

1) 분석(A)>기술통계량(E)>빈도분석(F)

 

2) 분석하고자 하는 변수들을 오른쪽으로 옮기고 "빈도표 표시(D)"박스는 반드시 해제하고, "확인" 버튼을 누른다.

 

결과

AST에는 원래 8개의 결측치가 있었는데, AST를 이용하여 산출한 변수들은 그 값을 모두 결측치로 반환하고 있음을 알 수 있다.

 

-사실 SPSS는 이러한 산술 연산이 매우 귀찮게 되어있어서 상대적으로 복잡한 분석이 필요해질 시점부터는 잘 사용하지 않게 되는 경향이 있다. 그래서 필자도 SPSS는 교육용 이외에는 거의 사용하지 않게 되었다. 

 

[SPSS] 변수 계산 (산술 연산) 정복 완료!

작성일: 2022.11.30.

최종 수정일: 2022.11.30.

이용 프로그램: IBM SPSS v26

운영체제: Windows 10

반응형
반응형

 

[SPSS] 조건에 맞는 데이터만 선택하기

 

 연구를 하다 보면 특정 조건에 맞는 사람들(데이터, 케이스)만을 대상으로 분석하고 싶어질 때가 있다. 즉 하위그룹(subgroup)을 만들어 분석을 하거나, 층화(stratification) 분석을 하고 싶을 때가 있다. 예를 들어, 남성만을 대상으로 하거나, 음주자만을 대상으로 하는 경우가 그렇다. 이렇듯 조건에 맞는 행, 데이터만 추출하는 법에 대해 알아보고자 한다.

 

*실습용 데이터는 아래 링크를 클릭하면 다운로드할 수 있습니다.

2022.08.04 - [공지사항 및 소개] - 분석용 데이터 (update 22.08.29)

 

분석용 데이터 (update 22.08.29)

2022년 08월 29일 버전입니다. 변수는 계속하여 추가될 예정입니다. 다음 카테고리에 있는 글에서 이용된 데이터입니다. - 기술 통계 - 통계 프로그램 사용 방법 1) 엑셀 파일 2) CSV 파일 3) 코드북

medistat.tistory.com

 

먼저 데이터를 불러온다. 데이터를 불러오는 방법은 다음 글을 확인하길 바란다.

2022.08.04 - [통계 프로그램 사용 방법/SPSS] - [SPSS] 데이터 불러오기 및 저장하기

 

 

하는 방법

1) 데이터(D)> 케이스 선택(S)

 

2) 조건을 만족하는 케이스(C)를 누르고 "조건(I)"버튼을 누른다.

 

3) 조건을 입력하면 된다. 여기에서는 음주자만 추출해보고자 한다. 음주자는 ALCOHOL 변수가 1로 코딩되어 있으므로 ALCOHOL=1이라고 적는다. "계속(C)"를 누른다.

 

4) "확인" 버튼을 누른다.

 

결과

위에서 볼 수 있듯이 ALCOHOL=0인 사람들은 사선 처리되어있는 것을 알 수 있다. 이 상태에서 다른 분석 (평균, 빈도, 회귀분석 등)을 시행하면 사선 처리가 되어있는 비음주자는 분석에 이용되지 않는다.

 

다중 조건 (AND)

조건이 하나가 아닌 여러 개를 걸고 싶을 때가 있다. 예를 들어 음주자 (ALCOHOL=1)이면서 현재 흡연자 (SMOK=2)인 데이터(행)만 추출하고 싶을 때다. 이럴 때에는 "&"연산자를 사용하여 다음과 같이 적으면 된다.

"ALCOHOL=1  &  SMOK=1"

 

결과

음주자가 아니거나 (ALCOHOL=0) 과거 흡연자(SMOK=1), 비흡연자(SMOK=0)인 경우 모두 사선 처리가 되어있는 것을 확인할 수 있다.

 

다중 조건 (OR)

만약 비흡연자를 제외하고 과거 흡연자(SMOK=1)이거나 현재 흡연자(SMOK=2)인 사람만 선택하고 싶다면 어떻게 해야 할까? 위와 같이 &를 사용할 수는 없다. 왜냐하면 SMOK=1이면서 SMOK=2일 수는 없기 때문이다. 이럴 때에는 OR에 해당하는 "|" 연산자를 사용해야 한다. 

"|"연산자는 직접 써도 되고, 익숙하지 않은 사람을 위해서 SPSS에서는 빨간 상자 안에 버튼을 만들어 놓았다.

 

결과

SMOK=0인 사람만 사선 처리되어있는 것을 알  수 있다.

 

 

다중 조건 (AND, OR)

만약, 음주자이면서 비흡연자가 아닌 (현재 흡연자 혹은 과거 흡연자)인 사람을 선택하려면 어떻게 해야 할까?

ALCOHOL=1 & (SMOK=1  |  SMOK=2)

AND연산자는 OR에 우선하기 때문에 반드시 괄호 처리를 해주어야 한다. 수학에서 $\times$가 $+$보다 우선하기 때문에 필요한 경우 괄호를 씌우는 것과 동일하다.

결과

비음주자이면서 비흡연자는 모두 사선 처리된 것을 알 수 있다.

 

다시 되돌아가고 싶다면?

케이스 선택에서 "모든 케이스(A)"를 클릭하고 확인을 누르면 된다.

 

결과

모든 사선이 사라진 것을 확인할 수 있다.

 

SPSS 케이스 선택 정복 완료!

작성일: 2022.09.29.

최종 수정일: 2022.09.29.

이용 프로그램: IBM SPSS v26

운영체제: Windows 10

 
반응형
반응형

[SPSS] 데이터 불러오기 및 저장하기

1. 데이터 불러오기

2. 데이터 저장하기

 

SPSS를 이용할 때 데이터를 불러오는 방법과 저장하는 방법을 알아보겠다.

 

*실습용 데이터는 아래 링크를 클릭하면 다운로드할 수 있습니다.

2022.08.04 - [공지사항 및 소개] - 분석용 데이터 (update 22.08.04) - 기술 통계

 

분석용 데이터 (update 22.08.04) - 기술 통계

2022년 08월 04일 버전입니다. 변수는 계속하여 추가될 예정입니다. 다음 카테고리에 있는 글에서 이용된 데이터입니다. - 기술 통계

medistat.tistory.com

 

 

1. 데이터 불러오기

1) SPSS에서 데이터를 불러오기 위해서는 다음과 같이 선택을 해야 한다.

 

엑셀 파일:

파일 > 데이터 가져오기 (D) > Excel...

CSV 파일:

파일 > 데이터 가져오기 (D) > CSV 데이터...

 

 

2) 파일이 있는 위치에서 원하는 파일을 선택하고 "열기 (O)"버튼을 누른다.

 

 

 

3) 그 다음에 나오는 창은 특별한 경우가 아닌 이상 설정을 만지지 말고 "확인" 버튼을 누른다.

*특별한 경우

 1) 첫 번째 체크박스: 첫 번째 행에 변수 이름이 존재하지 않고 바로 데이터부터 나올 경우 첫 번째 체크 박스 ("데이터 첫 행에서 변수 이름 읽어오기 (V)")를 해제한다. 

 2) 두 번째 체크박스: 100개의 데이터 중 95개 이상이 '숫자'라면 변수의 유형을 '숫자'로 지정하겠다는 것이다. 이 기준을 더 엄격하게 하고 싶다면 95보다 큰 숫자를, 느슨한 기준으로 평가하겠다면 95보다 낮은 숫자를 입력한다.

 3) 세 번째 체크박스: 엑셀에서 '행 숨기기' 혹은 '열 숨기기'로 특정 데이터가 보이지 않게 처리하였고, SPSS에 파일을 불러온 뒤에도 그 데이터들을 보고 싶지 않다면 체크박스를 해제하지 않는다. 만약 숨긴 데이터도 보고 싶다면 체크박스를 해제한다.

 

4) 데이터가 잘 불려온 것을 확인한다.

 

 

사실 더 간단한 방법이 있는데, 원하는 데이터 파일을 드래그하여 SPSS 창 중 어떤 곳에든지 내려놓는 것이다.

그러면 첫 번째, 두 번째 단계를 뛰어넘게 된다.

 

2. 데이터 저장하기

 SPSS에서 다뤘던 데이터를 저장하고 싶을 때가 생기기 마련이다.

 

1) 다음과 같이 클릭한다.

엑셀 파일:

파일 > 내보내기 (T) > Excel...

CSV 파일:

파일 > 내보내기 (T) > CSV 데이터...

 

2) 저장하고자 하는 위치와 파일 이름을 지정한다.

3) 저장하고자 하는 변수를 선택한다.

선택하기 위해서는 "변수(V)"버튼을 클릭하여 원하는 변수의 체크박스에만 체크를 한다. 필자는 두 개의 변수를 모두 선택했다.

"계속(C)"버튼을 누르고 위 그림에서 "저장(S)"을 누르면 저장이 된다.

 

 

SPSS 데이터 불러오기 및 저장하기 정복 완료!

 

작성일: 2022.08.04.

최종 수정일: 2022.08.08.

이용 프로그램: IBM SPSS v26

운영체제: Windows 10

반응형

+ Recent posts