빅데이터/빅데이터 분석 기사 - 빅데이터 분석 기획

[빅데이터 분석 기획] 데이터 비식별화

언제나휴일 2022. 3. 28. 15:00
반응형

1. 데이터 비식별화 처리 기법

  • 가명처리

개인정보를 직접 식별할 수 없는 다른 값으로 대체하는 기법

예) 임석정  임꺽정, 장문석 → 장영실

  • 총계처리

특정 데이터의 값을 판단할 수 없도록 평균값 등으로 처리하는 기법

예)임석정 183cm, 장문석  175cm,...   빅데이터 분석학과 학생 키 평균: 177cm

  • 범주화

대푯값이나 구간값으로 변환

임석정 43세   임꺽정 40대

  • 데이터 마스킹

개인정보의 전체 혹은 부분을 공백이나 * 등의 대체값으로 변환하는 기법

예) 임석정, 한국 대학교 재학   임OO, OO대학교 재학

  • 데이터값 삭제

개인정보의 식별 가능한 값을 삭제하는 기법

장문석, 721212-1234567  장OO, 72년생 남자

2. 개인정보 익명 처리 기법

  • 가명처리(Pseudoym)

개인정보를 직접 식별할 수 없는 다른 값으로 대체하는 기법

예) 임석정  임꺽정, 장문석 → 장영실

  • 일반화(Generalization)

보다 일반적인 값으로 대체하는 기법

예) 지역 번호 12345   지역 번호 12OOO

  • 섭동(Perturbation)

원래 데이터를 왜곡시켜 원래 값을 모르게 만드는 기법

예) 43세, 54세, 33세 → 31세, 42세, 21세  (원래 나이에 12살을 뺀 값으로 왜곡시킴)

  • 치환(Permutation)

데이터의 컬럼 순서를 무작위로 변경하는 기법

 

반응형