• Tidak ada hasil yang ditemukan

일본 개인정보보호위원회의 익명가공정보 활용 관련 보고서에 있는 활 용사례를 소개하면 다음과 같다.49)

신용카드 사업자가 보유하는 카드 이용내역에 대해서 익명가공을 실시 한 후에 익명가공정보 시스템을 활용하여 일반사업자에게 제공한다. 일반 사업자는 제공받은 익명가공정보에 근거하여 연수입이나 직업과 이용 가 맹점 등의 관계를 분석하여 마케팅에 활용한다.

49) 한국인터넷 진흥원, “2017년 해외 개인정보보호 동향 분석” 중 “일본 개인정보보호위원회의 익명가공정보 활용 관련 보고서(’17.2.27) 분석”, 132~133쪽

(2) 활용 사례의 검토

위의 활용 사례를 보면, 이름, ID, 신용카드 번호, 전화번호 등의 식별 자는 개인 특정의 위험성이 높고 데이터 분석에 필요한 정보도 아니므로 삭제한다. 다만 신용카드 거래 정보에 다른 정보를 결합하여 분석하는 등 각 개인별로 데이터를 구분할 필요성이 있을 때에는 삭제하지 않고 다른 정보로 대체한다.

생년월일, 상세 주소는 식별자에 해당하지만, 데이터 분석에 필요하고 그대로 사용하면 개인 특정의 위험성도 높으므로 일부 삭제 또는 범주화 로 대체한다.

근무처, 연수입, 신용카드 이용일, 이용가맹점, 이용금액 등은 속성자에 해당하고, 데이터 분석에 유용한 정보이므로 일부 삭제 또는 범주화로 대 체한다. 다만 연수입 중 초고소득 인물, 카드 이용 빈도가 매우 낮은 가맹 점 정보, 초고액의 이용 금액 정보는 개인을 특정할 가능성이 있으므로 삭제한다.

(3) 기존 비식별화 방식에 대한 평가

이름, 전화번호 등의 식별자는 개인 또는 개인과 관련한 사물에 고유 하게 부여되는 값 또는 이름이기 때문에, 이를 삭제하거나 가명화 등을 통해 대체하지 아니하면 개인이 특정될 가능성이 높다. 또한 식별자는 통 상 각각의 데이터를 구분하는 기능 외에는 데이터 이용 목적 달성을 위해 필요한 정보가 아니므로 삭제하거나 대체하더라도 데이터 분석 가치가 하 락되지 아니한다.

속성자는 성별, 연령 등 개인적 특성, 신장, 병명 등 신체적 특성, 세금 납부액 등 신용 특성, 학교명, 직업 등 경력 특성, 배우자, 자녀 등 경력 특성 등 개인과 관련된 정보이다. 그 자체로 개인이 특정되지는 아니하지 만 다른 정보와 결합되면 개인이 특정될 수 있다. 특히 희귀병명, 희귀경 력 등의 속성자는 구체적인 상황에 따라 개인 식별 가능성이 매우 높다.

그래서 연구 목적 달성을 위해 필요한 속성자라고 하더라도 일부 삭제 하거나 범주화 등의 방법으로 데이터의 식별 위험성을 줄여야 한다. 그 과정에서 원본 데이터가 변형되기 때문에 정확한 분석결과 도출이 어려워 진다. 그렇다고 분석의 정확성의 높이기 위해 데이터 범위 구간을 좁히는 경우 특정인 추론 가능성이 높아진다.

데이터 분석 목적으로 데이터를 사용하려는 쪽은 최대한 데이터의 원 형을 유지한 상태에서 데이터를 활용하기 원한다. 원본 데이터에 기초한 데이터의 분석 결과와 변형된 데이터에 기초한 데이터의 분석 결과 사이 에 차이가 크다면 데이터 활용의 가치가 별로 없게 된다. 그래서 데이터 의 왜곡 정도를 최소화하면서도 데이터 분석의 유용성을 확보할 수 있는 방식이 있다면, 비식별화 기법들 중에서 이 방식이 선호될 것이다.50)