자격증/DAP

[DAP] 과목1 전사아키텍처 이해 - 제 2장 - 제 3절 데이터아키텍처 구축 프로세스

뜽배 2025. 3. 27. 19:51
728x90
반응형

DAP(Data Archtecture Professional) 책을 통해 내가 공부한 내용을 요약한 것 

 

제 2장 - 데이터아키텍처 구축


제1장 전사아키텍처와 데이터아키텍처

제 2장 데이터아키텍처 구축

제 3장 데이터 거버넌스


제 1절 데이터아키텍처 방향 수립

제 2절 데이터아키텍처 정보 구성 정의

제 3절 데이터아키텍처 구축 프로세스


1. 데이터아키텍처 정보 구축 준비

* 자료수집

데이터아키텍처 정보를 구축하기 위해서 먼저 기존에 작성된 자료를 수집해야 한다.

데이터에 관련된 분석 및 설계 단계의 산출물을 확인해야한다. 필요한 자료가 매트릭스에서 정의한 산출물의 형식 그대로 존재하기 않을 경우가 있는데, 이런 경우에 유사한 산출물을 활용하거나 필요시 생성 또는 보완 작업을 수행해야 한다.

 

* 데이터아키텍처 정보 구축 방식

데이터아키텍처 정보 구축 방식에는 상향식과 하향식이 있다.

 

1) 상향식

최하위에 있는 구성요소를 조사 분석하여 구성요소들의 공통점을 파악하여 공통적인 구성요소들을 모아 상위 구성요소를 정의 

-> 장점 : 조직의 모든 데이터가 포함되는 것을 보장할 수 있는 장점

-> 단점 : 상위 계층 데이터 구조 수준이 서로 다르게 나타날 수 있음

 

2) 하향식

최상위의 구성요소로부터 시작하여 분류 기준을 따라 하위 구성요소를 도출해 내는 방식

-> 장점 : 일반적인 분류 기준이나 목적에 따른 기준을 따르기 때문에 관점이 명확함

-> 단점 : 일부 업무가 누락될 가능성이 있으며, 어디에도 포함되지 않는 구성요소가 발생할 수 있다.

 


2. 현행 데이터아키텍처 정보 구축

현재 업무나 정보시스템, 데이터 주제영역 구성에 대해 기존의 데이터 관련 자료를 분석하여 데이터의 현재 모습에 해당하는 데이터아키텍처 정보를 구축하는 것을 말한다.

 

상위 수준의 업무 기능과 시스템 또는 데이터 주제영역에 대한 분류를 우선 수행한 후 그 기준에 따라 나머지 데이터아키텍처 정보를 구축하는 것이 효율적이다.

상위 수준의 분류 기준이 정리되면 나머지 정보 구축은 병렬적으로 수행해도 된다.

현행 데이터 아키텍처는 아키텍처 매트릭스의 전 범위에 걸쳐 수행하는것이 바람직하며, 각 셀에서 정의하고 있는 산출물을 기준으로 현재 관리되고 있는 모델 및 문서를 정립·보완하여 현행화하는 작업을 수행한다.

 

* 현행 데이터아키텍처 정의 내역

1) 전사 데이터 영역 식별

2) 데이터베이스 개체 파악 및 분석

3) 현행 데이터 구조 정보 정의

  - 현행 데이터 주제영역 정의

  - 현행 물리 데이터 모델 정의

  - 현행 논리 데이터 모델 정의

  - 현행 개념 데이터 모델 정의

4) 현행 데이터 표준 정보 정의

  - 현행 데이터 원칙, 표준, 관리 프로세스 파악

5) 현행 데이터 흐름 정보 정의

6) 현행 데이터 관리 정보 정의

 

* 현행 데이터 분석

가장 먼저 할 일은 전사 데이터 영역 범위를 파악하는 것과 필요한 자료를 수집하는 것이다.

현행 데이터 분석을 통해 파악한 문제점은 현행 데이터 구조의 문제점과 밀접하게 연관되며, 현행 데이터 구조의 개선 방향을 도출하는 기초 자료로 활용된다.

 

* 현행 데이터 표준 분석

전사 데이터 영역으로 파악한 범위에 대해 현재 적용하고 있는 데이터 표준의 존재 여부데이터 표준 구성 현황 · 적용 범위 및 준수도 등을 파악하고, 현행 데이터 표준이 존재하는 경우 현행 데이터 및 데이터 구조에 대해 적용되고 있는지 현황을 파악한다.

 

* 데이터 요구사항 분석

현행 및 목표 시스템에 대한 데이터 요구를 수집하여 현행 데이터에 대한 이해 증진 및 목표 데이터 구조 설계 시 방향 도출의 근거로 활용한다.

 

* 현행 물리 데이터 모델 도출

현행 물리 데이터 모델 도출은 테이블, 컬럼 등 데이터베이스 개체 정보로부터 물리 데이터 모델을 생성하는 작업으로, 생성한 물리 데이터 모델을 ER다이어그램으로 표현된다.

관계파악은 역공학으로 생성되었는지 확인해야한다. 외부키의 경우 개발 시 불편 감소를 이유로 설정을 하지 않고 운영되는 경우도 있기 때문이다.

 

* 현행 논리 데이터 모델 도출

현행 논리 데이터 모델 도출은 데이터베이스의 테이블 구조를 그대로 표현한 현행 물리 데이터 모델로부터 데이터 집합의 논리적 형태로 전황하여 현행 논리 데이터 모델을 생성하는 작업이다.

테이블 구조가 아니라 대상 데이터의 논리적 형태를 표현하기 위한 것이기 때문에 이해를 위해 한글화가 필수적이다.

데이터 구조에 대한 정확한 이해를 위해 명칭은 매우 중요한 요소이며, 가능한 한 구체적으로 상세한 표현을 해야한다.

정확한 의미 전달이 어려운 경우 상세한 설명 내용을 추가해 주여야 한다.

  현행 데이터 모델은 엔터티나 속성의 명칭 이외에도 정확한 관계 파악과 표현, 데이터 집합에 대한 통합적 형태 정의 등 구체적으로 표현하는 것이 매우 중요하다.

  중요한 것은 영문명으로 표현된 물리 데이터 모델을 단순히 한글명으로 전환했다고 해서 논리 데이터 모델이 되는 것은 아니다.

 

* 현행 개념 데이터 모델 도출

  현행 개념 데이터 모델 도출은 현행 논리 데이터 모델의 엔터티에 대해 의미나 성격이 유사한 것들을 그룹핑하여 추상화 수준을 높여 데이터 모델로 정의하는 작업이다.

  개념데이터 모델을 논리 데이터 모델에 정의된 많은 엔터티와 데이터 구성을 한눈에 파악할 수 있도록 주요 데이터를 중심으로 요약해서 표현한 것이라 할 수 있다.

  개념 데이터 모델로 정의하는 데이터의 범위는 보통 주제영역 단위이며, 규모나 의사결정에 따라 대주제영역이나 중주제영역, 소주제영역 단위로 정의할 수 있다.

 

* 현행 주제영역 모델 도출

  현행 주제영역 모델 도출은 현행 전사 데이터 범위에 대해 데이터 주제영역 구성을 파악하여 분류하는 작업으로, 주제영역의 분류와 구성은 전사 데이터를 한눈에 조망하고, 전사 데이터가 어떤 체계로 구성되어 관리되는지 파악할 수 있다.

 

* 현행 데이터 구조 문제점 및 개선방안 도출

  현행 데이터 구조에 대해 물리 ·논리 ·개념 데이터 모델로 추상화 수준을 높여가면서 계층적으로 구성하는 것은 주요 데이터 위주로 신속하게 파악할 수 있도록 하기 위함이다.

  단순히 데이터 모델을 그려내는 것이 목표가 아니라 현행 데이터 모델을 구체화 하면서, 문제와 원인 개선방안 등을 도출할 수 있어야 한다.

 


3. 목표 데이터아키텍처 정보 구축

목표 데이터아키텍처 구축은 현행 데이터아키텍처에 대한 문제점 분석 및 개선 방향 도출 결과를 토대로 , 데이터 참조모델에서 바람직한 선진 모델 구조를 참조하거나 재사용할 데이터 구조 등을 파악하고, 이를 목표 데이터아키텍처에 반영하는 과정으로 진행된다.

일반적으로 초기 목표 데이터아키텍처 수립 시에는 현행 데이터아키텍처 수립과 달리 데이터아키텍처 매트릭스의 개념적 수준까지 정의한다.

현행 데이터아키텍처를 구축하는 과정이 상향식으로 접근하게 되는 반면, 목표 데이터 아키텍처를 구축하는 과정은 하향식으로 접근하는 것이 일반적이다.

 

 

* 목표 데이터아키텍처 정의 내역

1) 목표 데이터 표준, 관리 프로세스 정의

2) 목표 데이터 주제영역 모델 정의

3) 목표 개념 데이터 모델 정의

4) 목표 논리 데이터 모델 정의

5) 목표 물리 데이터 모델 정의

6) 목표 데이터베이스 개체 정보 구축

7) 목표 데이터 흐름 정의

 

 

* 목표 데이터 표준, 관리 프로세스 정의

현행 데이터아키텍처를 구축하고 현행 데이터 구조의 문제점과 개선방향을 도출한 후, 이 결과에 데이터 관련 요구사항을 반영하여 목표 데이터아키텍처를 수립하기 위한 목표 데이터 표준과 데이터 관리 프로세스를 정의한다.

 

* 목표 데이터 주제영역 정의

  목표 데이터 주제영역 정의는 전사 데이터 범위 정의, 데이터아키텍처 원칙, 데이터 요구사항 , 현행 데이터아키텍처 분석 결과를 토대로 하여 전사 차원의 데이터를 일관된 뷰로 조망할 수 있도록 데이터를 분류하는 것이다.

업무별로 사일로(Silo)구조가 되지 않도록 유사한 데이터별로 하나의 통합된 분류 구조로 정의해야 한다.

주제영역은 데이터의 성격이나 의미, 용도 등을 고려하여 유사성이 높은 것들을 그룹화하고 체계적으로 분류함으로써 시스템간 동일 또는 유사데이터가 중복 정의되지 않도록 할 수 있다.

* 목표 개념 데이터 모델 정의

  목표 개념 데이터 모델 정의는 목표 데이터 주제영역 정의 결과를 토대로 주제영역별로 주요 데이터와 이들간의 관계를 도출하여 목표 데이터 구조의 골격을 정의하는 작업이다.

 

* 목표 논리 데이터 모델 정의

  목표 개념 데이터 모델을 토대로 개념 데이터 모델에 정의된 주요 데이터들 간의 관계에 대한 세부 내용을 도출하여 데이터 구조의 상세한 논리 모델을 표현하는 것이다.

 

* 목표 물리 데이터 모델 정의

  목표 물리 데이터 모델 정의는 논리 데이터 모델을 특정 DBMS에 맞게 최적화한 형태로 정의하는 작업이다.

 

* 목표 데이터베이스 개체 정보 구축

  목표 데이터베이스 개체 정보 구축 시 물리 데이터 모델에 정의된 물리 데이터 요소를 생성하려는 DBMS의 구성과 생성되는 개체의 정보, 활용방법 설계 등이 반영된다.

 

* 목표 데이터 흐름 정의

  목표 데이터 흐름 정의는 별개로 분리되어 구축되는 정보시스템이나 외부의 정보시스템들과 데이터 교환을 통해 목표 시스템이 완전한 기능을 발휘하고 전사적인 통합 시스템 체계를 완성할 수 있도록 시스템 간의 데이터 이동을 정의하는 것이다.

 


4. 목표 데이터아키텍처 이행 계획 수립

 목표 데이터아키텍처 이행 계획은 현행 데이터아키텍처에서 목표 데이터아키텍처로의 이행을 위한 전략을 수립하고 구체적인 이행 계획을 수립하는 것이다.

728x90
반응형