A. 데이터 경제 시대의 디지털 금융서비스와 보안

1. 데이터 경제와 디지털 금융서비스

1-1. 데이터 3법 (개정)

  • 2020년 1월 개정된 데이터 3법이 8월 5일 시행
  • 데이터 3법은 개인정보 보호법, 정보 통신망법, 신용 정보법
  • 주요 개정사항
    • 데티어 이용 활성화를 위한 가명 정보 개념 도입
    • 개인정보 보호 협치(거버넌스) 체계의 효율화 추구
    • 데이터 활용에 따른 개인정보 처리자의 책임 강화
    • 모호한 '개인 정보' 판단 기준의 명확화

 

데이터 3법 개정을 통해서 가명화된 다양한 정보를 상업적 목적으로 한 통계작성과 산업적 목적을 포함한 과학연구 등은 사용자의 동의를 구하지 않고 사용할 수 있게 되었으며 공공 데이터 포털, 금융 데이터 거래소 등을 이용하여 빠르고 편한 정보 접근이 가능하도록 했습니다. 이와 같은 법과 제도의 정비는 우리가 데이터 경제 시대에 비로소 진입하는 시발점이라고 할 수 있습니다.

 

데이터 3법 개정

 

1-2. 데이터 경제

  • '데이터'가 미래 지속 가능 성장의 핵심자원으로서 가치를 지님
  • 데이터의 수집/분석/활용 등이 중요한 경제활동 생산요소인 경제구조

 

데이터 경제 시대를 이끌기 위해 정부에서 추진하는 금융권의 주요 사업으로서 MyData 사업과 금융 빅 데이터 인프라 구축 사업이 있는데요. 이 중 금융 빅데이터 인프라에는 금융 데이터 거래소, CreDB(크레 디비), 금융 공공 데이터 개방 서비스, 금융 결재원 개방 시스템의 세부 사업 등이 포함되어 있습니다.

 

정부 주도의 금융권 주요사업

 

1-3. MyData 사업 개요

지금까지는 개인을 대상으로 한 금융 서비스에서는 금융회사 같은 서비스 제공 주체가 개인의 동의를 얻고 개인 정보를 수집, 처리하고 활용하였으나 정보 주체인 개인이 자신의 개인 정보를 활용하는 것에 대한 결정에 소외되는 정보보호 문제가 대두되었습니다. 이를 해소하기 위해 정부에서는 금융 분야 MyData 사업을 추진하고 있으며 대다수의 은행, 카드 등 금융기관이 사업을 추진 중에 있는데요, MyData 사업은 본인 신용 정보의 체계적인 관리를 지원함과 동시에 소비 패턴 등의 분석을 통해 개인의 신용 관리 및 자산관리 서비스를 제공하는 것입니다.

 

1-4. 다른 나라의 예시

유럽에서는 이미 MyData와 유사한 사업을 진행하고 있다고 하는데요, 유럽은 16년에 제정된 일반 개인정보 보호법, GDPR을 통해 개인의 정보에 대한 통제권을 개인에게 부여하고 타 사업체가 개인이 선택한 자신의 정보를 활용할 수 있게 하였습니다. 이는 관련 사업에 중요한 법적 근거가 되었으며 실제로 MyData와 유사한 서비스입니다.

 

MyData 사업의 주요 내용은 우선, 정보 주체인 개인이 '정보 이동권 ‘에 근거하여 본인 데이터에 대한 개방을 요청하면 금융기관 같은 기업이 보유한 데이터를 서비스 제공자인 개인(요청자) 또는 개인이 지정한 제3자에게 개방하도록 하는 것입니다. 이들은 주로 개인정보를 활용한 서비스를 제공하는 핀테크 기업이나 타 금융기관 등이 됩니다. 본인이 개인 데이터 활용에 대한 결정을 함으로써 개인 정보에 대한 통제력을 강화하는 것이라고 할 수 있습니다. 사업자 측면에서는 개인이 제공을 허가한 개인 정보를 바탕으로 정보 제공자인 소비자에게 혜택을 줄 수 있는 다양한 서비스를 제공할 수 있게 되는 것이죠.

 

1-5. MyData 사업 도입시 가능한 것들

  • 신용 정보 통합 조회로 분산되어 있는 개인 금융거래 정보를 통합, 가공하여 제공할 수 있습니다. 개인이 거래하는 금융회사/웹사이트 방문 없이도 본인 금융 정보를 한번에 조회할 수 있죠.
  • 수집된 개인 금융정보 등을 기초로 개인 재무 현황을 분석할 수 있습니다. 고객의 금융 거래 데이터 집계하여 고객의 소비패턴, 재무상태 등을 분석하여 결과를 제공합니다.
  • 신용 관리 정보 지원 서비스가 가능합니다. 개인 재무 현황을 기초로 신용 상태 개선을 위한 맞춤형 재무 컨설팅과 본인 정보관리 업무에 대한 서비스를 제공할 수 있습니다.
  • 개인 재무 현황을 기초로 개인에게 맞춤형으로 금융 상품을 추천할 수 있습니다. 개인의 현 재무 현황 및 신용 상태에 따라 상품별 가격과 혜택을 비교하여 개인에게 최적화된 금융상품을 추천할 수 있습니다.

 

1-6. MyData 사업의 기대 효과

금융산업 부분

금융 상품간 비교, 공시가 강화되어 금융 산업 내 경쟁과 혁신이 촉진될 것이고, 정보 우위에 기반하여 이익을 추구해온 금융회사들의 영업 행태가 시정되고 소비자 만족을 위한 경쟁이 확산될 것으로 기대됩니다. 고객 데이터 공유로 기존에 대형금융사들이 정보를 독점하고 대형금융사에만 시장 영향력을 집중된 것이 완화될 것으로 기대됩니다. 핀테크나 데이터 산업에 있어서는 금융 소비자에게 맞춤형 정보를 수집, 유통하는 정보중개업자로 산업적 역할을 수행할 수 있을 것이며 또한, 데이터 기반 핀테크 혁신을 주도하면서 전통적 금융 산업, 데이터 산업의 잠재적 경쟁자로 자리매김이 가능할 것입니다.

 

전반적인 국민경제 측면

고객 데이터에 대한 수집과 분석이 활성화될 경우 창업 활성화를 위한 빅데이터 수요 등의 대응이 가능하게 될 것이며, 전 후방 연관 효과로 고부가가치의 금융 분야 데이터 산업이 형성되고 일자리가 창출될 것으로 기대합니다.

 

1-7. 금융 빅데이터 시스템 개방

 디지털 경제, 데이터 경제시대에서 데이터 개방 및 활용은 필수인데요, 금융위원회에서는 이를 위해 기업들이 데이터를 원활히 활용할 수 있도록 유관기관과 함께 데이터를 개방, 유통, 결합하는 금융 분야 빅데이터 인프라 구축을 추진 중에 있습니다.

 

신용정보원의 신용 정보를 활용한 CreDB(크레 디비) 구축, 데이터 공급자와 수요자를 매칭하여 결제를 지원하는 금융 데이터 거래소 출범, 금융위원회 및 9개 공공기관이 보유한 금융공공데이터 개방 서비스, 데이터 3법 개정안에 포함된, 가명 처리된 데이터를 안전하게 결합할 수 있는 데이터 결합 전문기관 지정 사업, 금융결제원이 가진 계좌이체 정보 등 금융 결제 정보를 비식별화 하여 개방할 수 있는 금융결제원 빅데이터 개방 시스템 사업은 빅데이터 인프라 구축 사업의 주요 과제입니다.

 

이러한 사업을 추진함으로써, 인슈어테크(InsureTech) 등 신 서비스 개발이 가능할 것을 기대하고 있으며, 특정 대상에 심화된 정교하고 심도 있는 심층 분석 및 연구 수행을 지원이 가능하고, 다양한 데이터 간 융합을 통해 새로운 가치 창출과 신용 정보 빅데이터를 활용한 AI 산업의 성장과 연구 촉진이 가능할 것으로 기대됩니다.

 

1-8. 금융 데이터 거래소

금융 빅데이터 시스템 개방정책의 일환으로 금융 데이터 거래소가 2020년 5월 11일 출범하였습니다. 이 금융 데이터 거래소는 공급자와 수요자가 상호매칭하여 비식별 정보, 기업 정보 등의 데이터를 거래할 수 있는 중개 시스템을 운영하고, 데이터를 철저하게 가명화하여 정보 유출 방지를 위한 보안성을 강화하였습니다. 또한, 금융권 뿐 아니라 통신, 유통 등 일반 상거래 기업도 참여하여 다양한 거래가 가능하며 금융권과 그 외 산업을 연결하는 개방형 거래소를 지향하고 있습니다.

 

1-9. 금융 데이터 거래소 거래 프로세스

먼저 데이터를 판매하는 사업자가 금융 데이터 거래소에 데이터를 등록합니다. 데이터를 사용하려는 수요자는 금융 데이터 거래소에서 원하는 데이터를 검색하고 필요한 데이터가 있다면 데이터 공급자와 데이터 수요자 간의 데이터 거래 계약서를 작성합니다. 이후 거래 계약서에 따라서 암호화된 데이터가 금융 데이터 거래소를 통해 데이터 수신자에게 전달되며 필요할 때 수요자가 원하는 데이터나 제공 형태 등을 공급자에게 직접 요청하는 수요자 중심 거래도 가능합니다. 이러한 방식으로 금융 데이터 거래소는 데이터 전문기관으로 지정된 금융보안원의 허용 범위 내에서 각 데이터를 결합하여 새로운 서비스를 개발하는데도 기여할 수 있습니다.

 

예를 들어 비식별화된 보험회사의 사고 정보와 차량 안전장치 정보를 결합하여 보험료 할인 상품을 만드는데 활용할 수 있으며 소셜 데이터와 종합주가지수를 연계한다면 로보 어드바이저(Robo Advisor)에 활용할 수도 있을 것입니다. 그리고 공공 데이터의 상권 정보와 이에 연관된 카드 매출 정보를 결합하여 상권분석 서비스를 개발할 수도 있습니다. 금융 데이터 거래소를 초기 활성화하기 위한 몇가지 방안을 마련하였는데요. 우선, 데이터 유통에 금융회사들이 적극적으로 참여하도록 금융권 데이터 유통 가이드라인을 마련하였습니다.

 

그리고 초기 데이터 거래 활성화를 위해 금융 데이터 거래소를 통한 거래 시 데이터 바우처를 지원하며, 데이터 유통에 대한 업무는 금융업 임을 명확히 하여 관한 부수 업무 신고를 허용하였습니다. 이처럼 다양한 활성화 지원 방안을 통해 금융 데이터 거래소는 데이터 생태계 조기 구축 및 다양한 혁신 금융 서비스를 발굴하는 역할을 할 것입니다. 또한 안전한 금융 분야 초기 빅데이터 유통시장 조성에도 크게 기여할 것으로 기대합니다.

 

2. 데이터 경제 시대의 안전한 데이터 활용 노력

2-1. 안전한 데이터 활용을 위한 비식별 조치

데이터 3법 개정으로 비식별화된 정보인 가명정보라는 개념을 신설하고, 해당 가명정보는 정보 제공자 동의 없이 활용 가능하다는 근거를 마련하였는데요. 이러한 데이터 활용에 있어서 중요한 전제 조건은 개인정보를 비식별화하여 안전하게 활용해야 한다는 것입니다. 비식별화 조치는 기존에도 진행되고 있었지만, 데이터 3법 개정으로 인해 그 중요성이 더 커진 것이죠.

 

안전한 데이터 활용을 위한 비식별 조치

 

2-2. 비식별 조치 프로세스

1단계는 사전 검토 단계입니다. 사전 검토 단계에서 개인 정보에 해당하는지를 검토 후, 개인 정보가 아닌 것이 명백한 경우 법적 규제 없이 자유롭게 활용합니다. 2단계는 비식별 조치 단계로 정보 집합물(데이터 셋)에서 개인을 식별할 수 있는 요소를 전부 또는 일부 삭제하거나 대체하는 등의 방법을 활용, 개인을 알아볼 수 없도록 하는 조치를 말합니다. 다음 3단계는 적정성 평가입니다. 다른 정보와 쉽게 결합하여 개인을 식별할 수 있는지를 「비식별 조치 적정성 평가단」을 통해 평가하고 사후관리 단계에서 비식별 정보 안전조치, 재식별 가능성 모니터링 등 비식별 정보 활용 과정에서 재식별 방지를 위해 필요한 조치를 수행합니다. 비식별 적정성 평가에서 부 적정 판정을 받으면 다시 비식별 조치를 보완하여 적정성 평가를 받고 통과하여 활용 가능한 비식별 정보가 됩니다. 그러나 비식별 조치된 개인정보라도 다른 정보와 결합되면, 재식별될 수 있으므로 관리적, 기술적 보호조치가 필요 합니다.

 

비식별 조치 프로세스

 

관리적 보호조치는 비식별 정보 파일에 대한 관리 담당자 지정, 비식별 조치 관련 정보 공유 금지, 이용 목적 달성 시 파기 등의 조치를 말합니다. 그리고 기술적 보호조치는 비식별 정보 파일에 대한 접근통제, 접속기록 관리, 보안 프로그램 설치·운영 등의 조치를 말합니다. 

 

관리적, 기술적 보호조치

 

2-3. 재식별 가능성 모니터링

이렇게 비식별 정보를 이용하거나 제3자에게 제공하려는 사업자 등은 해당 정보의 재식별 가능성을 정기적으로 모니터링해야 해야 합니다. 이 때, 내부 요인이나 외부 환경의 변화에 따라 다른 점검 항목이 적용되는데요, 먼저 내부 요인의 변화에 대한 점검 항목으로는 비식별 조치된 정보와 연계하여 재식별 우려가 있는 추가적인 정보를 수집하였거나 제공받는 경우와, 데이터 이용 과정에서 생성되는 정보가 비식별 정보와 결합해서 새로운 정보가 생성되는 경우가 있습니다. 또한, 이용 부서에서 비식별 정보에 대한 비식별 수준을 당초보다 낮추어 달라고 하는 요구가 있는 경우, 그리고 신규 추가로 구축되는 시스템이 비식별 정보에 대한 접근을 관리, 통제하는 보안 체계에 중대한 변화를 초래하는 경우가 있습니다.

 

다음으로 외부 환경 변화에 대한 점검 항목을 살펴보겠습니다. 먼저 이용 중인 데이터에 적용된 비식별 조치 기법과 유사한 방법으로 비식별 조치한 사례가 재식별 되었다고 알려졌거나, 이용 중인 데이터에 적용된 비식별 기법과 기술을 무력화하는 새로운 기술이 등장하거나 공개된 경우가 있으며, 이용 중인 데이터와 새롭게 연계 가능한 정보가 공개된 경우 역시 모니터링을 통해 점검해야 합니다.

 

내부 외부 환경의 변화

 

2-4. 비식별 조치의 세부 기술 및 평가 방법

개인 정보의 비식별 조치를 위한 세부 기술로서 대표적인 일반적인 기법으로는 가명 처리, 총계 처리, 데이터 삭제, 데이터 범부화, 데이터 마스킹 기법이 있습니다.

 

가명 처리 기법은 개인 식별이 가능한 데이터를 직접적으로 식별할 수 없는 다른 값으로 대체하는 기법으로 주로 성명, 출신학교, 근무처 등 개인의 고유 특징 데이터가 가명 처리 기법의 대상입니다. 해당 기법은 데이터 변형 및 변질 정도가 낮은 장점이 있지만 단점은 대체 처리 후에도 식별 가능한 속성은 계속 유지될 수 있다는 점입니다. 세부 기술로는 휴리스틱 가명화, 암호화, 교환 방법이 있습니다.

 

가명 처리

 

총계 처리 기법은 통계 값(전체 또는 부분)을 적용하여 특정 개인을 식별할 수 없도록 하는 기법입니다. 해당 기법의 장점은 민감한 수치 정보에 대하여 비식별 조치가 가능하며 통계분석용 데이터 셋 작성에 유리하지만 단점으로는 정밀 분석이 어려우며, 집계 수량이 적을 경우에 추론에 의한 식별에 취약할 수도 있다는 점을 들 수 있습니다. 세부 기술로는 총계 처리, 부분 총계, 라운딩, 재배열이 있습니다.

 

총계 처리

 

데이터 삭제 처리 기법은 개인 식별이 가능한 데이터를 삭제 처리하는 것입니다. 개인 식별 요소의 전부 또는 일부의 삭제가 가능한 효율적인 비식별 방법이지만 분석의 다양성과 분석 결과의 유효성 및 신뢰성이 저하될 수 있습니다. 세부 기술로는 식별자 삭제, 식별자 부분 삭제, 레코드 삭제, 식별 요소 전부 삭제가 있습니다.

 

데이터 삭제

 

데이터 범주화 기법은 특정 정보를 해당 그룹의 대푯값으로 변환하거나 구간 값으로 변환하여 개인 식별을 방지하는 기법입니다. 해당 기법은 통계형 데이터 형식으로 변환하여 다양한 분석 및 가공이 가능한 장점이 있으나, 단점은 정확한 분석 결과 도출이 어려우며, 데이터 범위 구간이 좁혀질 경우 추론 가능성이 있다는 점입니다. 세부 기술로는 감추기, 랜덤 라운딩, 범위 방법, 제어 라운딩이 있습니다.

 

데이터 범주화

 

데이터 마스킹 기법은 데이터의 전부 또는 일부분을 대체 값(공백 및 노이즈)으로 변환하는 기법입니다. 해당 기법은 개인 식별 요소를 제거하는 것이 가능하며 원 데이터 구조의 변형이 적지만 마스킹을 과도하게 적용할 경우 데이터 필요 목적에 활용하기 어려우며 마스킹 수준이 낮을 경우 특정한 값에 대한 추론이 가능하다는 단점이 있습니다. 세부 기술로는 임의 잡음 추가와 공백과 대체가 있습니다.

 

데이터 마스킹

 

이 외에도 최근에는 차분 프라이버시, 동형 암호 등 데이터의 유용성은 훼손시키지 않으며, 안전성을 높일 수 있는 다양한 비식별 조치 신기술 개발을 하고 있습니다.

 

2-5. 비식별 조치 평가 방법

프라이버시 모델 K IT

 

K-익명성 모델

이 중 가장 많이 사용하는 것이 k-익명성 모델입니다. k-익명성 모델은 주어진 집합 값에서 같은 값이 적어도 k 개 이상 존재하도록 하여 쉽게 다른 정보로 결합할 수 없도록 하기 위한 모델입니다. k-익명성의 취약점인 동질성 공격 등을 보완하기 위해서 l-다양성 프라이버시 모델을 사용합니다.

 

K-익명성 모델

 

I-다양성 모델 & T-근접성 모델

l-다양성 프라이버시 모델은 주어진 데이터 집합에서 함께 비식별 되는 레코드들은 적어도 l 개의 서로 다른 민감한 정보를 가져야 하는데요, l-다양성에 의해서 다양화된 정보가 특정 정보에 집중해서 분포되어 있거나 정보가 서로 유사하다면 취약점이 될 수 있습니다. 이런 l-다양성 프라이버시 모델의 취약점을 보완하기 위한 것이 t-근접성 모델입니다. t-근접성은 동질 집합에서 특정 정보의 분포와 전체 데이터 집합에서 정보의 분포가 t 이하의 차이를 보여야 하는 것입니다.

 

I-다양성 모델 & T-근접성 모델

 

2-6. KIT 개념 정리

 

KIT 개념 정리

 

2-7. k-익명화, l-다양성, t-근접성 단계적 적용 예시

k-익명화, l-다양성, t-근접성 단계적 적용 예시

 

이는 비식별화된 데이터를 평가할 수 있는 모형을 만드는 것을 보여 주는데요, 보고 계시는 공개 의료 데이터의 사례에서 지역 코드, 연령, 성별을 알면 민감 정보인 질병이 무엇인지 알 수 있습니다. 만약 지역 코드, 연령, 성별이 있고 이름이나 주민번호가 포함된 타 자료와 결합한다면 누가 어떤 질병에 걸렸는지 알아낼 수 있게 되는 것입니다. 이는 개인 정보 침해 소재가 있으므로 k-익명성 기법을 사용하여 비식별화를 진행합니다.

 

4개의(k 개)의 레코드를 가진 집합을 만들고, 지역 코드 , 연령, 성별에 대해서 동일한 값을 가지도록 범주화 및 마스킹 처리를 진행합니다. 이로써 공격자는 집합에서 어떤 대상이 공격 대상인지 정확히 알아낼 수 없습니다. 같은 속성자 값들로 비식별된 레코드 모임을 동일 속성자 값 집합이라고 합니다. 하지만 민감 정보인 질병의 종류가 한 동일 속성자 값 집합에 한 가지만 있다면 민감 정보를 유추할 수 있기 때문에 충분히 비식별화가 되었다고 판단하기 어렵습니다.

 

이때 l-다양성 보호 모델을 활용해 추가적인 비식별화를 진행합니다. 다음과 같이 데이터 이동 및 재 범주화를 통해 동일 속성자 값 집합 내에 다양한 질병이 분포하도록 하였습니다. 그러나 다양성을 통해 어느 정도 질병의 유형은 분산이 되어도 특정 질병이 동일 속성자 값 집합에 많이 분포할 경우나 유사한 병명이 분포할 경우에는 공격자는 민감 정보를 유추할 수 있습니다.

 

이럴 경우에 분산을 t 이하로 재조정하는 t-근접성 프라이버시 모델에 기반하여 데이터 이동 및 재범주화를 통한 비식별화를 다시 진행합니다. 정부는 앞에서 살펴본 것과 같이 안전하고 체계적인 비식별 조치를 지원하기 위해 각 분야별 비식별 조치 전문기관을 선정하였는데요, 이 전문기관들을 통해 비식별 조치 적정성 평가단 풀 구성 및 운영, 산업별 비식별 조치 수준 이행 권고, 비식별 조치 적정성 실태 점검, 교육 및 컨설팅, 정보 집합물 결합 지원, 국내외 비식별 조치 관련 정책 및 제도, 그리고 기술 동향 조사 및 연구에 대한 지원 등의 역할을 수행하도록 하였습니다. 각 분야 별 전문기관 및 역할은 다음과 같습니다. 

 

각 분야 별 전문기관 및 역할