데이터 모델링/03. 논리 모델링
데이터 표준화 (5)
developer-soyun
2024. 11. 7. 23:48
데이터 표준화
- 데이터 항목 (틀) 에 대한 명칭과 의미를 정한다
- 실제 정하고 활용하는 데이터 값(내용)에 대한 형식 및 범위를 규정하는 활동
- 의사소통을 원활하게 할 수 있다
- 개발 생산성을 높일 수 있다
- 표준단어는 독립적인 형태로 기본단어 중 분류단어가 도메인 단위가 된다
- 도메인(분류단어)는 여러 인포타입을 가지며, 인포타입은 DBMS의 데이터타입과 길이를 포함
- 표준용어는 표준단어들의 조합이며, 도메인의 특정인포 타입을 가지게 된다
단어 표준화
- 단어는 용어를 구성하는 최소 단위의 낱말을 의미한다
- 단어 표준화는 업무 또는 IT에서 사용하는 단어를 식별하고 정의하는 과정이다
- ex) 하청업체 X, 협력업체 O
도메인 표준화 (도메인 사전 p161쪽 참고하기)
- 도메인은 데이터에 대한 형식(문자형, 숫자형, 날짜형)과 범위 (타입, 길이) 를 규정한다
- 데이터 값의 허용 범위를 결정하므로, 1차적으로 데이터 값의 품질을 높일 수 있다
✨코드 표준화
- 업무에서 통계를 내거나 한정된 데이터 값을 목록화하여 관리하고자 하는 대상을 코드로 식별하여 정의한다
- Internalization - 국제화 (I18N)
코드체계 | 코드체계 설명 | 코드 예시 |
분류형 (부모의 값을 가지고 있는 것) | - 대/중/소 세분류 형태의 계층형 코드체계 - 코드 자리수에 의미를 부여하여 사용한다 |
한국표준산업 분류 01 : 농업 011: 작물 재배업 0111 : 곡물 및 기타 식량작물 재배업 012 : 축산업 |
일련번호형 | - 일련번호와 같이 의미없는 번호를 순차적으로 부여한다 - 길이만큼 앞에 '0'을 채운다 |
고객유형 01 : 개인 02 : 법인 99 : 기타 |
약어형 | - 의미를 지니는 영문약어명으로 코드를 부여한다 | 성별 M : 남자 F : 여자 |
차용형 | - 일반적으로 통용되는 코드를 그대로 사용한다 | 은행코드 001 : 한국은행 002 : 산업은행 003 : 기업은행 |