반응형
1. 데이터 비식별화 처리 기법
- 가명처리
개인정보를 직접 식별할 수 없는 다른 값으로 대체하는 기법
예) 임석정 → 임꺽정, 장문석 → 장영실
- 총계처리
특정 데이터의 값을 판단할 수 없도록 평균값 등으로 처리하는 기법
예)임석정 183cm, 장문석 175cm,... → 빅데이터 분석학과 학생 키 평균: 177cm
- 범주화
대푯값이나 구간값으로 변환
임석정 43세 → 임꺽정 40대
- 데이터 마스킹
개인정보의 전체 혹은 부분을 공백이나 * 등의 대체값으로 변환하는 기법
예) 임석정, 한국 대학교 재학 → 임OO, OO대학교 재학
- 데이터값 삭제
개인정보의 식별 가능한 값을 삭제하는 기법
장문석, 721212-1234567 → 장OO, 72년생 남자
2. 개인정보 익명 처리 기법
- 가명처리(Pseudoym)
개인정보를 직접 식별할 수 없는 다른 값으로 대체하는 기법
예) 임석정 → 임꺽정, 장문석 → 장영실
- 일반화(Generalization)
보다 일반적인 값으로 대체하는 기법
예) 지역 번호 12345 → 지역 번호 12OOO
- 섭동(Perturbation)
원래 데이터를 왜곡시켜 원래 값을 모르게 만드는 기법
예) 43세, 54세, 33세 → 31세, 42세, 21세 (원래 나이에 12살을 뺀 값으로 왜곡시킴)
- 치환(Permutation)
데이터의 컬럼 순서를 무작위로 변경하는 기법
반응형
'빅데이터 > 빅데이터 분석 기사 - 빅데이터 분석 기획' 카테고리의 다른 글
[빅데이터 분석 기획] 데이터 품질 검증 (0) | 2022.03.29 |
---|---|
[빅데이터 분석 기획] 데이터 유형 및 속성 파악 (0) | 2022.03.28 |
[빅데이터 분석 기획] 데이터 수집 (0) | 2022.03.28 |
[빅데이터 분석 기획] 분석 절차 및 작업 계획 (0) | 2022.03.27 |
[빅데이터 분석 기획] 데이터 확보 계획 (0) | 2022.03.27 |