
02. 데이터 정제 01. 데이터 품질 방법론 1) 데이터 품질 방법론의 개념 고품질의 데이터를 운영, 관리하기 위하여 일련의 데이터 관리 활동들을 체계적인 흐름으로 표현한 프로세스 데이터 품질 방법론에는 데이터 관리 정책, 데이터 표준 관리, 데이터 모델 관리, 데이터 흐름 관리, 데이터베이스 관리, 데이터베이스 보안, 데이터 활용 관리, 요구사항 관리가 있음 2) 데이터 표준 관리 데이터 표준 정의 해당 기관에서 사용하는 용어 및 도메인, 코드, 데이터 관련 요소에 대한 표준을 전사적으로 정의하는 작업 표준에 따른 원칙을 정의하고 사용자의 표준화 요건을 수렴한 후 각 표준화 요소에 대한 전사 표준을 정의함 데이터 표준 변경 정의된 데이터 표준에 대한 요구사항을 반영하는 변경 관리 작업 데이터 표준 평..

태그: #정보처리기사 01. 데이터 전환 01. 데이터 전환 전략 1) 데이터 전환 전략의 개념 기존의 원천 시스템에서 데이터를 추출하여 목적 시스템의 데이터베이스에 적합한 형식과 내용으로 변환한 후, 목적 시스템에 적재하는 일련의 과정 기존에 운영되던 데이터를 목적 시스템으로 안정적으로 변환할 수 있도록 데이터 변환 전략을 이용하여 전환을 수행함 2) 데이터 전환 단계 데이터 전환 절차는 데이터 전환 환경에 따라 다소 차이가 발생할 수 있기 때문에 포괄적인 개념에서 접근 및 적용이 필요함 데이터 전환 단계는 시스템 개발 단계와 유사한 측면이 있음 시스템 개발 단계 데이터 전환 단계 요구사항 분석 단계 데이터 전환 계획 및 요건 정의 설계 단계 데이터 전환 설계 구현 단계 데이터 전환 개발 테스트 단계 ..

04. 분산 데이터베이스 설계 01. 트랜잭션 분석 1) 트랜잭션 분석의 개념 데이터베이스에서 행해지는 작업의 논리적인 단위로써 테이블에 발생하는 업무 트랜잭션 양에 따라 데이터베이스의 용량을 산정하여 데이터베이스의 구조를 최적화하는 데 목적이 있음 2) 트랜잭션 분석의 활용 용량 산정의 근거 자료 테이블의 생성 트랜잭션을 분석하면 테이블에 저장되는 데이터양을 유추할 수 있고 이를 근거로 데이터베이스 용량을 산정할 수 있음 디스크 구성의 이용 트랜잭션 분석 결과를 이용하여 프로세스가 과도하게 발생하는 테이블에 대해서는 디스크를 여러 곳에 배치하여 디스크 입출력을 분산시켜 성능에 많은 향상을 기할 수 있음 데이터베이스와 연결되는 채널의 분산 채널별로 집중화된 트랜잭션을 분산시킴으로써 대기 현상이나 타임 아..

03. 반정규화 수행 01. 반정규화(De-Normalization) 1) 반정규화의 정의 정규화된 엔티티, 속성, 관계를 시스템의 성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링 기법 완벽한 수준의 정규화 모델링을 수행하면 종속성, 활용성은 향상되더라도 처리 속도가 느려질 수 있기 때문에, 이런 경우를 극복하기 위해 성능에 중점을 두어 정규화하는 방법을 반정규화라고 함 2) 반정규화의 특징 정규화된 데이터 모델링 규칙에 구애받지 않고 수행함 물리적으로 구현되었을 때 성능 향상을 목적으로 함 논리 모델링에서 수행된 정규화 작업을 통해 데이터 모델은 데이터 중복의 최소화와 데이터의 일관성, 정확성, 안정성 등을 보장하는 데이터 구조를 완성할 수 있음 반정규화는 정규화..

02. 저장 레코드 형식 설계 01. 저장 테이블(Stored Table) 1) 저장 테이블 1. 저장 테이블의 개념 가장 기본적 데이터베이스 객체인 테이블은 행과 열로 구성되며, 데이터베이스의 모든 데이터는 테이블에 저장됨 상용 DBMS에서 제공되는 테이블들은 DBMS마다 명칭과 기능 등이 약간의 차이가 있음 데이터의 저장 형태와 파티션 여부, 데이터의 유지 기간 등에 따라 테이블을 다양하게 분류할 수 있음 2. Heap-Organized Table(일반 유형 테이블) 대부분의 상용 DBMS에서 표준 테이블로 사용하고 있는 형태 테이블 내에서 튜플의 저장 위치는 특정 속성의 값에 기초하지 않고 해당 튜플이 삽입될 때 결정됨 3. Clustered Index Table(클러스터 인덱스 테이블) 기본키 및..

01. 물리 데이터 모델 설계 01. 물리 데이터 모델 변환 1) 개체를 테이블로 변환 논리적 설계(데이터 모델링) 물리적 설계 개체(Entity) 테이블(Table) 속성(Attribute) 컬럼(Column) 주 식별자(Primary Identifier) 기본키(Primary Key) 외래 식별자(Foreign Identifier) 외래키(Foreign Key) 논리 모델에서 정의된 개체는 물리 모델에서 테이블로 변환 테이블과 개체명을 동일하게 하는 것을 권장함 개체명은 한글명을 사용하고, 테이블은 소스 코드의 가독성을 위해 영문명을 사용함 사전에 표준화된 용어가 있을 경우 메타에 등록되어 있는 단어를 사용하여 명명함 서브 타입 변환 논리 데이터 모델에서는 비즈니스나 업무를 데이터 모델로 표현하므로 ..

05. 병행 제어와 로킹 01. 병행 제어 1) 병행 제어(Concurrency Control, 동시성 제어)의 목적 여러 사용자들이 데이터베이스의 공동 사용을 최대화함 사용자의 응답 시간을 최소화함 데이터베이스 시스템의 활용도를 최대화함 데이터베이스의 일관성을 유지함 2) 병행 처리의 문제점 분산된 갱신(Lost update) 두 개의 트랜잭션이 있을 때 같은 데이터에 대해서 한 개의 트랜잭션 작업이 갱신 작업이고 또 하나의 트랜잭션이 역시 같은 데이터에 대해서 갱신 작업이라고 했을 때 하나의 작업이 분실되는 현상이 벌어지는 경우 모순성(Inconsistency) 두 개의 트랜잭션이 있을 때 같은 데이터에 대해서 한 개의 트랜잭션 작업이 갱신 작업을 하고 있는 상태에서 또 하나의 트랜잭션이 침범하여 갱..

04. SQL 지원 도구 01. 데이터 사전(Data Dictionary) 1) 데이터 사전의 개념 데이터베이스에 포함되는 모든 객체에 관한 정의나 명세에 관한 정보를 메타 데이터 형태로 유지 관리하는 곳 메타 데이터의 유형 : 사용자 정보(아이디, 패스워드 및 권한 등), 무결성 제약 정보, 함수, 트로시저 및 트리거 등 여러 가지 스키마와 이들 속에 포함된 사상들에 관한 정보도 컴파일되어 저장됨 사전 자체도 하나의 데이터베이스로 간주하며, 시스템 카탈로그라고도 함 2) 데이터 사전 테이블 CHARACTER_SETS : 사용 가능한 모든 문자 셋에 대한 정보 COLLATIONS : 데이터베이스에 저장된 값들을 비교, 검색하거나 정렬 등의 작업을 위해 문자들을 서로 비교할 때 사용하는 규칙들의 집합으로 ..