• Tidak ada hasil yang ditemukan

본 연구에서는 돌봄 정책의 발전이 임금분위에 따라서 어떻게 다른 영향을 미쳤 지가 주요 관심이다. 이를 위해서는 종속변수의 평균에서 독립변수의 영향을 확인

하는 OLS(Ordinary Least Square)분석으로는 충분하지 않으며, Koenker and Bassett Jr (1978)가 제안한 (조건부) 분위회귀분석(Conditional Quantile Regression, 이하 CQR)이 고려될 수 있다. CQR은 오차의 제곱합의 값을 최소화 하는 OLS 분석과 달리, 오차(u)의 절대값에 분위 τ 의 가중치를 준 𝜌 𝑢 을 최소 화하는 방식으로 분위별 회귀계수를 구할 수 있다. 이러한 CQR은 임금분포전체를 확인할 수 있다는 장점이 있다.

(4)

그러나 본 연구에서는 CQR의 두 가지 한계로 인하여 Firpo et al. (2009)가 제 안한 무조건부 분위회귀분석(Unconditional Quantile Regression, UQR)을 사용 할 계획이다. 첫번째로 CQR의 결과는 본 연구의 목적에 맞도록 해석할 수 없다. 본 연구의 목적은 종속변수인 임금의 τ번째 분위에서 독립변수인 X가 미치는 영향을 확인하고자 하는 것으로 𝑑𝑞 𝑥 /𝑑𝑥의 직접 효과를 구하는 것이다. Firpo외 저자들 은 CQR이 이를 계산하기에 적절치 않다고 보았다. CQR의 회귀계수 𝛽 𝐹 τX 1 𝐹 τX 0 는 X가 유일한 독립변수이자, 이분변수인 상황을 제 외하고는 𝑑𝑞 𝑥 /𝑑𝑥 Pr𝑌 𝑞 |𝑋 1 Pr𝑌 𝑞 |𝑋 0 /𝑓 𝑞 과 일치하지 않 기 때문이다. 즉, CQR에서 종속변수인 분위의 분포가 독립변수를 조건부로 달라지 며, 회귀계수는 독립변수를 조건부로 한 부분효과이다. 따라서 CQR에서 회귀계수 는 모든 독립변수들의 조합이 같은 집단 내(within) 효과를 나타낸다(Firpo et al., 2009). 가령 저임금 분위에서 특정한 훈련 프로그램의 효과가 유의한 영향을 미쳤 을 경우, 이는 저임금이던 사람이 훈련을 통하여 덜 가난해졌음을 나타내기 보다는, 훈련이 있는 체제(regime)에서 가난한 사람이 훈련이 없는 체제 보다 덜 가난해졌 다는 정도로만 해석을 할 수 있다(Angrist & Pischke, 2008, p.281). 즉, 분위별 로 다른 회귀계수의 값을 절대적인 차원으로 비교하여 해석할 수 없다.

CQR의 이러한 한계에 관한 논쟁으로는 모성 패널티의 임금계층별 효과를 다룬 Budig and Hodges (2010)의 연구와 이를 반박한 Killewald and Bearak (2014) 의 연구가 있다. 어머니로의 이행이 저임금층과 고임금층에서 임금에 미치는 영향 이 다를 것이라는 가설을 확인하기 위하여 Budig and Hodges (2010)는 일반적으 로 사용되는 UQR을 실시하였으며, 그 결과 고임금층에 비하여 저임금층에서 더 큰 모성 패널티를 경험한다는 결론을 내렸다. 그러나 Killewald and Bearak (2014) 는 이러한 해석에 문제를 제기하였는데, 가령 로그 임금을 종속변수로 어머니 여부

𝜌 𝑢 1 𝑢 0 ∙ 𝜏 |𝑢| 1 𝑢 0 ∙ 1 𝜏 |𝑢|

와 교육수준을 독립변수로한 조건부 분위회귀분석에서 75퍼센타일의 여성이 겪는 모성 임금 패널티가 5%이고, 25퍼센타일의 여성이 겪는 모성 임금 패널티가 15%

라는 결과가 나왔을 경우, 이는 실제로는 교육수준을 조건부로 높은 임금을 받는 여 성들이 교육수준을 조건부로 낮은 임금을 받는 여성들에 비하여 더 작은 모성 패널 티를 받는다는 결과이므로 Budig와 Hodges처럼 해석할 수 없다는 것이다. 이처럼 임금 분위별 회귀계수의 값을 절대적으로 비교하여 볼 수 없다는 점에서 CQR은 본 연구에 부합하지 않는다고 보았다.

본 연구에서 CQR을 적용하기 어려운 두번째 이유는 분해분석에 제약이 있기 때 문이다. 물론 CQR을 토대로 분해분석을 실시한 선행연구도 있다. 가령 Machado and Mata (2005)는 포르투갈 데이터를 토대로 1986년과 1995년 두 시점 사이의 격차를 임금분포를 고려하여 분해하였다. 이는 각 변수가 1986년처럼 분포되었더 라면 1995년에 임금이 어떻게 분포했을지를 시뮬레이션으로 구하여 분위수마다 두 시점 사이 임금 차이를 비교한 것이다. 이러한 방법은 그러나 투입한 변수의 순서에 따라 결과가 달라지는 경로의존적 방법이며, 사례수가 클수록 계산적으로 부담이 크 다. 무엇보다도 CQR을 통하여 현실의 분포를 정확하게 찾아내는 데에는 제약이 있 다(N. Fortin et al., 2011).

무조건부 분위회귀분석(이하 UQR)은 위와 같은 제약없이 실제 임금의 분포를 기준으로 서로 다른 회귀계수의 값을 구할 수 있으며, 선형회귀분석을 적용하므로 분해분석을 무리없이 적용할 수 있다는 장점이 있다. Firpo et al. (2009)가 제안한 이 방법은 계량적 모형에서 강건한 추정을 위해서 사용되는 영향함수(Influence Function)라는 개념을 기반으로 한다. 가령 𝑣 𝐹 라는 어떠한 분포통계치 (distributional statistic)의 영향함수인 IF Y;𝑣,𝐹 는 개별 관측치가 분포통계치에 미치는 영향을 나타낸다. 이 영향함수에 𝑣 𝐹 을 더한 것이 재중심화 영향함수 (Recentered Influence Function, 이하 RIF)이다. RIF의 특징은 이의 기대값이 본래 통계치인 𝑣 𝐹 이 된다는 점이다. Firpo et al. (2009)는 𝑣 𝐹 는 분산이나 Gini계수와 같은 통계치뿐만 아니라 분위수에도 적용할 수 있다고 보았는데, 가령 본 연구에서 관심이 있는 Y의 τ분위의 RIF는 아래와 같이 나타낼 수 있다.

(5)

여기서 𝑞 는 해당 분위의 종속변수의 값이며, 𝑓 𝑞 는 𝑞 에서 Y의 밀도함수(가 령, kernel 밀도함수), 1 𝑌 𝑞 는 지표(indicator)항으로 Y의 값이 𝑞 와 같거나 작

RIF Y;𝑞 ,𝐹 𝑞 𝜏 1 𝑌 𝑞 𝑓 𝑞

을 경우 1이 된다. 즉, RIF는 해당 분위를 기준으로 Y의 값을 변환하는 것이다. 이 렇게 구해진 새로운 종속변수에 일반적인 OLS회귀분석을 적용하면 해당 분위에서 독립변수의 계수(𝛾 , 를 간단하게 확인할 수 있게 된다.

(6)

이는 종속변수의 분포 전체를 한번에 분석하는 CQR과 달리 특정 분위의 국지적 인(locally) 변화만을 확인하는 방식이다.

UQR는 본 연구가 확인하고자 하는 임금 분위별 계수의 효과를 절대적인 수준에 서 비교할 수 있으며, OLS분석을 적용하므로 BO 분해분석이 가능하다는 점에서 본 연구의 목적에 부합한다. 가령 (6)의 식에서 구한 회귀계수를 이용하여 아래 식(7) 과 같이 두 집단의 특정 분위에서의 임금 격차를 계수 효과와 구성 효과로 구분하여 살펴볼 수 있으며, 각 계수의 세부분해 역시 가능하다(N. Fortin et al., 2011).

(7)

본 연구에서는 UQR을 활용하여 10분위, 25분위, 50분위, 75분위, 90분위에서 남성과 여성의 임금 격차를 살펴보았다. 각 분위별 분석은 종속변수에 RIF를 적용 할 뿐 평균에서의 격차를 나타내는 OLS와 동일한 방식으로 수행되므로, 아래 분석 전략에서는 평균을 기준으로 내용을 작성하였다. 그러나 실제 분석은 분위별로 실 시하였다.