차수별 데이터를 종으로 합치는 방법(set) - FAQ의 예제 프로그램 사용 전 기본 숙지사항

FAQ의 예제 프로그램 사용 전 기본 숙지사항

2. 차수별 데이터를 종으로 합치는 방법(set)

차수별 시계열 분석을 위해서 데이터를 종으로 합쳐야 하는 경우가 자주 발생한다. 이러한 경우 각 차수별 공통적으로 포함된 변수를 추출한 뒤 변수명을 동일하게 변경 후 종으로 합치면 된다.

그런데, 이미 통합데이터(LONG TYPE)에 1~5차년도 모든 변수를 종으로 붙여서 제공하기 때 문에 필요한 변수만 따로 저장하여 사용하는 것이 더욱 편리할 것이다.

따라서, 두 가지 경우에 대한 절차를 다음과 같이 설명한다.

(1) 1~5차년도 메인 데이터를 종으로 합치는 방법

① 각 차수별 공통변수들의 변수명을 동일하게 변경한다.

② 각 차수별로 구분할 수 있는 더미 변수를 만든다.

③ 1~5차년도의 자료를 종으로 합친다.

================SAS================

data a1;

set psed.main1;

keep pid p01 emp012 emp013 emp015;

if p=1 then dummy=1;

rename p01=p emp012=emp2 emp013=emp3 emp015=emp5;

run;

data a2;

set psed.main2;

keep pid p02 emp022 emp023 emp025;

if p=2 then dummy=2;

rename p02=p emp022=emp2 emp023=emp3 emp025=emp5;

run;

장애인고용패널 유저가이드

6 - 10 data a3;

set psed.main3;

keep pid p03 emp032 emp033 emp035;

if p=3 then dummy=3;

rename p03=p emp032=emp2 emp033=emp3 emp035=emp5;

run;

data a4;

set psed.main4;

keep pid p04 emp042 emp043 emp045;

if p=4 then dummy=4;

rename p04=p emp042=emp2 emp043=emp3 emp045=emp5;

run;

data a5;

set psed.main5;

keep pid p05 emp052 emp053 emp055;

if p=5 then dummy=5;

rename p05=p emp052=emp2 emp053=emp3 emp055=emp5;

run;

data b;

retain pid p emp2 emp3 emp5 dummy;

set a1 a2 a3 a4 a5;

run;

================SPSS================

get file='d:\psed\spss\main1.sav' /keep=pid p01 emp012 emp013 emp015

/rename=(p01=p) (emp012=emp2) (emp013=emp3) (emp015=emp5).

compute dummy=1.

save out='d:\psed\spss\a1.sav' compressed.

장애인고용패널 유저가이드

6 - 11 get file='d:\psed\spss\main2.sav'

/keep=pid p02 emp022 emp023 emp025

/rename=(p02=p) (emp022=emp2) (emp023=emp3) (emp025=emp5).

compute dummy=2.

save out='d:\psed\spss\a2.sav' compressed.

get file='d:\psed\spss\main3.sav' /keep=pid p03 emp032 emp033 emp035

/rename=(p03=p) (emp032=emp2) (emp033=emp3) (emp035=emp5).

compute dummy=3.

save out='d:\psed\spss\a3.sav' compressed.

get file='d:\psed\spss\main4.sav' /keep=pid p04 emp042 emp043 emp045

/rename=(p04=p) (emp042=emp2) (emp043=emp3) (emp045=emp5).

compute dummy=4.

save out='d:\psed\spss\a4.sav' compressed.

get file='d:\psed\spss\main5.sav' /keep=pid p05 emp052 emp053 emp055

/rename=(p05=p) (emp052=emp2) (emp053=emp3) (emp055=emp5).

compute dummy=5.

save out='d:\psed\spss\a5.sav' compressed.

add files/file='d:\psed\spss\a1.sav' /file='d:\psed\spss\a2.sav' /file='d:\psed\spss\a3.sav' /file='d:\psed\spss\a4.sav' /file='d:\psed\spss\a5.sav' execute.

save out=/file='d:\psed\spss\b.sav' compressed.

================STATA================

use "d:\psed\stata\main1.dta", clear gen dummy=1

keep pid p01 emp012 emp013 emp015 dummy rename p01=p

rename emp012=emp2 rename emp013=emp3 rename emp015=emp5

save "d:\psed\stata\a1.dta", replace use "d:\psed\stata\main2.dta", clear gen dummy=2

keep pid p02 emp022 emp023 emp025 dummy rename p02=p

rename emp022=emp2 rename emp023=emp3 rename emp025=emp5

save "d:\psed\stata\a2.dta", replace use "d:\psed\stata\main3.dta", clear gen dummy=3

keep pid p03 emp032 emp033 emp035 dummy rename p03=p

rename emp032=emp2 rename emp033=emp3 rename emp035=emp5

save "d:\psed\stata\a3.dta", replace use "d:\psed\stata\main4.dta", clear gen dummy=4

keep pid p04 emp042 emp043 emp045 dummy rename p04=p

rename emp042=emp2 rename emp043=emp3 rename emp045=emp5

save "d:\psed\stata\a4.dta", replace

use "d:\psed\stata\main5.dta", clear gen dummy=5

keep pid p05 emp052 emp053 emp055 dummy rename p05=p

rename emp052=emp2 rename emp053=emp3 rename emp055=emp5

save "d:\psed\stata\a5.dta", replace

use "d:\psed\stata\a1.dta", clear appending use "d:\psed\stata\a2.dta"

appending use "d:\psed\stata\a3.dta"

appending use "d:\psed\stata\a4.dta"

appending use "d:\psed\stata\a5.dta"

order pid p emp2 emp3 emp5 dummy save "d:\psed\stata\b.dta", replace

(2) 통합데이터(LONG TYPE)에서 필요한 변수만 추출하기

통합데이터에는 이미 1~5차년도의 메인데이터가 종으로 합쳐진 파일이므로, 위의 과정을 거 치지 않고 바로 필요한 변수만 저장해서 사용할 수 있다.

또한, 아래 과정에서 변수를 rename 하지 않고 바로 필요한 변수만 추출하여 사용하면 된다.

이미 LONG TYPE 데이터 에서는 공통 변수명으로 rename이 된 상태이며 gubun 변수를 사용 하여 차수를 나타내었다. 모든 차수에서 조사된 변수가 포함되어 있으므로, 조사된 해당차수를 확인하는 것은 데이터 코딩북을 이용하면 된다.

================SAS================

data a1;

set psed.long;

keep pid p emp2 emp3 emp5; /*필요한 변수만 남기기*/

run;

장애인고용패널 유저가이드

6 - 14

================SPSS================

get file='d:\psed\spss\long.sav' /keep=pid p emp2 emp3 emp5.

sort cases by pid.

save out='d:\psed\spss\b.sav' compressed.

================STATA================

use "d:\psed\stata\long.dta", clear keep pid p emp2 emp3 emp5 sort pid

save "d:\psed\stata\b.dta", replace

장애인고용패널 유저가이드

6 - 15

Dalam dokumen 장애인고용패널조사 유저가이드 - KOSSDA - 서울대학교 (Halaman 53-56)