본문 바로가기

Dev/etc

데이터 비식별화 기법

1. 가명처리(pseudonymisation)

  • 식별 가능한 변수값을 다른 값으로 대체
  • *휴리스틱 가명화, 암호화, 교환방법 등
더보기

*휴리스틱 가명화(Heuristic Pseudonymization)

식별자에 해당하는 값들을 몇 가지 정해진 규칙으로 대체하거나 사람의 판단에 따라 가공하여 자세한 개인정보를 숨기는 방법
ex. 성명을 홍길동, 임꺽정 등 몇몇 일반화 된 이름으로 대체하여 표기하거나 소속기관명을 화성, 금성 등으로 대체하는 등 사전에 규칙을 정하여 수행

 

2. 총계처리(aggregation)

  • 개인정보 보호를 위해 데이터를 총합하거나 평균 사용
  • 총계처리, 라운딩, 부분총계, 재배열 방법 등을 사용

 

3. 데이터 삭제(data reduction)

  • 개인 식별이 유의한 변수값 제거
  • 식별자 삭제, 레코드 삭제, 식별자 부분 삭제, 식별 요소 전부 삭제 등을 사용

 

4. 범주화(data suppression)

  • 데이터값을 범주화하여 명확한 값을 큰 범주의 값으로 대체
  • 감추기, 범위화, 랜덤 라운딩, 제어 라운딩 등을 사용

 

5. 데이터 마스킹(data masking)

  • 개인 식별에 유의한 변수값을 보이지 않도록 처리
  • 임의잡음 추가, 공백과 대체, 기호와 대체 등의 방법 사용

 

참고

반응형

'Dev > etc' 카테고리의 다른 글

오픈소스 라이선스  (0) 2021.04.21
Analyzing Clubhouse for fun and profit  (0) 2021.03.12
무료 템플릿 사이트 (Canva, 미리캔버스, 망고보드)  (0) 2021.02.24
TDD(Test-Driven Development)  (0) 2021.02.23
심심할 때 타이핑하기  (0) 2019.07.09