반응형

IT 이야기/데이터베이스 16

병행제어

○ 병행제어(Concurrent Control) - 병행제어 실패시에는 갱신분실(Lost Update), 모순성(Inconsistency), 회복불능/연쇄복귀(Cascade Rollback)가 발생함. Binary Lock Shared Lock, Exclusive Lock Optimistic Concurrnecy Control 확인기법(Validation Schema) ° Lock이 걸린 상태와 해제된 상태의 두 가지 값을 가짐 ° Data에 접근전에 Locking 연산 수행 ° 다른 Transaction은 대기 ° 트랜잭션이 수행되는 동안 어떠한 검사도 하지 않음 ° 트랜잭션의 수행 마지막에 갱신 사항들이 직렬가능성을 위반하는지 검증 ° Lock과 Unlock는 나누어질 수 없는 단위로 구현되어야 함 ..

데이터품질관리

정의 ° 조직 내외부의 지식 노동자와 최종 사용자의 기대를 만족시키기 위한 지속적인 데이터 및 데이터 서비스 개선 활동 프레임 워크 ° 데이터 품질관리의 대상이 되는 구성요소와 요소들 간의 관계를 정의한 데이터 품질관리의 기본 개념틀 ° 데이터 품질관리 요소는 데이터(data value), 데이터 구조(data hierarchy), 데이터 관리 프로세스(data management process) 로 구분되며 각 요소들은 상호 연계되어 정보시스템의 데이터 품질에 영향을 주고 있으므로 통합적이고 체계적인 관리 노력이 요구됨 데이터 표준데이터 ° 표준단어, 표준도메인, 표준용어, 표준코드 모델데이터 ° 데이터 참조 모델, 개념/논리/물리 데이터 모델에 대한 메타데이터 및 DBMS 객체정보 관리데이터 사용관리..

(도서리뷰)OLAP 테크놀로지

OLAP 테크놀로지 - 박성진.조재희 지음/시그마인사이트컴 국내 OLAP관련 서적중에서는 고전적인 책이 아닐까 생각이 됩니다. 1999년도에 처음 발행된 책이지만 여전히 관련분야를 공부하는 많은 사람들이 꼭 한번쯤은 읽어보는 필독서라고 할 수 있죠. 저도 대학원에서 관련 분야 논문준비할 때에 2번 정도 정독하고 틈틈히 계속 참고했습니다. 정보의 가치는 데이터베이스에 쌓여있을 때 빛이 나는 것이 아니라 바로 사용자에게 또는 정보를 필요로 하는 사람에게 적절히 제공되어야 그 빛을 발산할 수 있습니다. 단순한 데이터의 제공이 아닌 정보의 제공, 이것이 의미하는 바는 적절하게 가공되고 분석된 사용자에게 가치있는 데이터를 말하죠. 이책은 바로 데이터의 활용 측면을 기술한 책입니다. 데이터를 신속하게 다양한 방식으..

(도서리뷰)하루 10분씩 핵심만 골라 마스터하는 SQL handbook

하루 10분씩 핵심만 골라 마스터하는 SQL 핸드북 - Ben Forta 지음, 최현호 옮김/정보문화사 제가 소장하고 있는 SQL 이나 DBMS관련 서적 중에서 가장 많이 레퍼런스하는 서적중의 하나입니다. 부록을 제외하고 총 22개의 단원으로 구성되어 있구요. 각 단원마다 4~6장 정도로 하루에 10분만 투자하면 정말로 한달 이내에 SQL을 마스터할 수 있는 분량입니다. 책의 사이즈도 A4용지 1/2 정도의 크기로 들고 다니기에도 무리가 없어 출퇴근 시에 잠깐씩 읽기에 좋고 필요할 때에 다시 참조하는 방식으로 활용하면 좋을 듯 싶습니다. 이 책의 내용은 데이터베이스 관리자, 데이터베이스 설계자들 보다는 SQL에 입문하는 학생, SQL을 활용하여 응용프로그램을 개발하는 프로그래머에게는 필수적인 책이라고 할..

조인(Join)의 종류

○ 조인(Join)의 종류 Nested Loops Join Sort Merge Join 개요 ° 선행 테이블의 어떤 범위의 집합(Outer)의 각 로우에 대하여 연결고리를 통해 반복적으로 대응되는 로우를 탐침(Iteration)한다 ° 두 개의 집합을 정렬하여 스캔하면서 연결 작업을 수행한다 특징 ° 선행 테이블의 처리범위가 일의 양을 결정 ° 반복 수행되는 연결 작업이 랜덤 액세스로 발생 ° 조인의 순서는 가능하면 'M' 집합을 나중에 처리 ° 부분범위 처리가 가능 ° 조인의 순서가 중요함(방향성) ° 연결고리에 마땅한 인덱스가 없는 경우 ° 대상 범위가 넓을 때 발생하는 랜덤 액세스를 부정적인 영향을 줄이기 위한 경우 ° 정렬을 해야 한다는 부담이 발생함 ° 정렬 후에 조인을 시작하므로 항상 전체범위..

분산데이터베이스

○ 분산 DB 정의 ° 논리적으로 같은 시스템에 속하지만 컴퓨터 네트워크를 통해 물리적으로 분산되어 있는 데이터들의 모임 ° 물리적 site분산, 논리적 사용자 통합, 데이터 공유 참조 구조 전역스키마 ° DB가 마치 분산되어 있지 않은 것처럼 분산DB에 포함된 모든 데이터를 정의 분할스키마 ° 분산을 위해 단편화(Fragmentation)된 구성에 대한 정의(일대다 관계) 할당스키마 ° 단편들의 위치정보를 정의 ° 유형에 따라 중복, 비중복인지가 결정됨 지역사상 스키마 ° 물리적 이미지를 해당 지역DBMS가 관리할 수 있도록 저장하기 위해 변환※ 네트워크 디렉토리 - 분산DBMS에서 각 노드의 주소, 처리 능력, 경로의 정의에 대한 정보를 수록 투명성 투 명 성 기 능 장 점 단 점 분할 ° 하나의 논..

회복기법(Recovery)

○ 회복(Recovery)기법 - 트랜잭션의 ACID 성질 중에서 영속성(Duration)의 측면 Check Point(Log 기반) ° Transaction 수행 중 발생하는 모든 변경사항을 Log에 기록하고 일정 기간 단위로 검사 시점을 생성하여 검사점 수행 ° 저장장치의 Log File에 검사점을 표시하여 기록함 ° 시스템 고장시 재실행할 트랜잭션과 취소할 트랜잭션을 찾기 위해 로그를 탐색해야 하는데 탐색할 로그의 양을 줄여준다 Log 기반 지연갱신 즉시갱신 ° Transaction이 부분완료 상태에 이르기까지 발생한 내용을 Log에 저장하고 DB는 지연 저장 ° Transaction 수행 중 발생하는 모든 변경사항을 즉시 Log와 DB에 반영 ° Transaction이 종료된 상태에서 회복은 Un..

데이터마이닝 환경에서의 프라이버시 보호기술

○ 데이터마이닝 환경에서의 프라이버시 보호기술 Indivisual Privacy ° Obscuring data - 개인의 식별 가능 정보만을 대상으로 random noise를 추가하는 방식 - 식별 가능한 정보를 제외한 다른 정보로부터 개인의 고급정보를 뽑아내는 문제 발생 - 데이터마이닝 결과의 정확도를 떨어뜨림 - ex) IBM의 '사생활 보호 데이터 마이닝(Privacy-Preserving Data Mining)‘ 솔루션 Perfect Privacy ° 개인의 모든 정보를 보호하는 개념 ° 개인의 보호받지 않아도 되는 정보들도 보호함으로서 데이터마이닝의 속도 및 기능 저하의 원인이 됨 ° 데이터마이닝과 개인정보 사이의 적절한 조화가 필요 ° Secret Sharing : (m,n)-역치방식 기본 개념..

OLAP

○ OLAP(Online Analytical Processing) MOLAP ROLAP 기반모델 다차원 데이터베이스 기반 관계형 데이터베이스 기반 차원모델 Hyper Cube, Multi Cube Star Schema 데이터 다양한 요약데이터를 최적화된 MMDB에 유지 상세데이터는 DW로부터 엑세스 상세 및 요약데이터 데이터조작 읽기/쓰기 읽기중심 데이터접근 정의된 차원으로 제한 임의의 질의 가능 연산 복잡한 계산을 위한 다양한 연산(복잡한 Application) 제한된 연산 성능 빠른 엑세스 보통 용도 EIS(Executive Information System)에 적합 대용량 Datawarehouse에 적합 - DOLAP(Desktop OLAP) : 다차원 데이터 저장, 프로세싱이 모두 클라이언트에서 ..

데이터마이닝

○ 데이터마이닝(Data Mining) 정의 ° 대용량 데이터집합(DW,웹로그)에서 아직 알려지지 않은 적합하고 종합적이며 실행 가능한 정보를 추출하고, 이를 사업의 핵심적인 의사결정에 활용하는 과정 기능 ° 검증 : 사용자 시스템이 가설을 입증 ° 발견 : 시스템이 자율적으로 새로운 패턴을 발견 ° 예측 : 미래의 패턴 예측 ° 묘사 : 사용자가 이용가능한 형태로 표현 특징 ° 지식 집약적 ° 3I 모델링 프로세스 - 반복적 분석(Iterative), 대화식 처리(Interactive), 증가치 방식(Incremental) ° 귀납적 결과에 초점 과정 샘플링(Sampling/Selecting) ° 방대한 데이터로부터 모집단 유형과 비슷한 작은 양의 데이터 추출 데이터정제/전처리(Data Cleaning..

반응형