반응형

데이터마이닝 2

데이터마이닝 환경에서의 프라이버시 보호기술

○ 데이터마이닝 환경에서의 프라이버시 보호기술 Indivisual Privacy ° Obscuring data - 개인의 식별 가능 정보만을 대상으로 random noise를 추가하는 방식 - 식별 가능한 정보를 제외한 다른 정보로부터 개인의 고급정보를 뽑아내는 문제 발생 - 데이터마이닝 결과의 정확도를 떨어뜨림 - ex) IBM의 '사생활 보호 데이터 마이닝(Privacy-Preserving Data Mining)‘ 솔루션 Perfect Privacy ° 개인의 모든 정보를 보호하는 개념 ° 개인의 보호받지 않아도 되는 정보들도 보호함으로서 데이터마이닝의 속도 및 기능 저하의 원인이 됨 ° 데이터마이닝과 개인정보 사이의 적절한 조화가 필요 ° Secret Sharing : (m,n)-역치방식 기본 개념..

데이터마이닝

○ 데이터마이닝(Data Mining) 정의 ° 대용량 데이터집합(DW,웹로그)에서 아직 알려지지 않은 적합하고 종합적이며 실행 가능한 정보를 추출하고, 이를 사업의 핵심적인 의사결정에 활용하는 과정 기능 ° 검증 : 사용자 시스템이 가설을 입증 ° 발견 : 시스템이 자율적으로 새로운 패턴을 발견 ° 예측 : 미래의 패턴 예측 ° 묘사 : 사용자가 이용가능한 형태로 표현 특징 ° 지식 집약적 ° 3I 모델링 프로세스 - 반복적 분석(Iterative), 대화식 처리(Interactive), 증가치 방식(Incremental) ° 귀납적 결과에 초점 과정 샘플링(Sampling/Selecting) ° 방대한 데이터로부터 모집단 유형과 비슷한 작은 양의 데이터 추출 데이터정제/전처리(Data Cleaning..

반응형