developer-soyun 2024. 11. 7. 23:48

데이터 표준화

  • 데이터 항목 (틀) 에 대한 명칭과 의미를 정한다
  • 실제 정하고 활용하는 데이터 값(내용)에 대한 형식 및 범위를 규정하는 활동
  • 의사소통을 원활하게 할 수 있다
  • 개발 생산성을 높일 수 있다

<자료> 행정안전부, “공공데이터베이스 표준화 관리 매뉴얼”, 2022. 재구성

  • 표준단어는 독립적인 형태로 기본단어 중 분류단어가 도메인 단위가 된다
  • 도메인(분류단어)는 여러 인포타입을 가지며, 인포타입은 DBMS의 데이터타입과 길이를 포함
  • 표준용어는 표준단어들의 조합이며, 도메인의 특정인포 타입을 가지게 된다

단어 표준화

  • 단어는 용어를 구성하는 최소 단위의 낱말을 의미한다
  • 단어 표준화는 업무 또는 IT에서 사용하는 단어를 식별하고 정의하는 과정이다
  • ex) 하청업체 X, 협력업체 O

도메인 표준화 (도메인 사전 p161쪽 참고하기)

  • 도메인은 데이터에 대한 형식(문자형, 숫자형, 날짜형)과 범위 (타입, 길이) 를 규정한다
  • 데이터 값의 허용 범위를 결정하므로, 1차적으로 데이터 값의 품질을 높일 수 있다

✨코드 표준화 

  • 업무에서 통계를 내거나 한정된 데이터 값을 목록화하여 관리하고자 하는 대상을 코드로 식별하여 정의한다
  • Internalization - 국제화 (I18N)
코드체계 코드체계 설명 코드 예시
분류형 (부모의 값을 가지고 있는 것) - 대/중/소 세분류 형태의 계층형 코드체계
- 코드 자리수에 의미를 부여하여 사용한다
한국표준산업 분류
01 : 농업
011: 작물 재배업
0111 : 곡물 및 기타 식량작물 재배업
012 : 축산업
일련번호형  - 일련번호와 같이 의미없는 번호를 순차적으로 부여한다
- 길이만큼 앞에 '0'을 채운다
고객유형
01 : 개인
02 : 법인
99 : 기타
약어형 - 의미를 지니는 영문약어명으로 코드를 부여한다 성별
M : 남자
F : 여자
차용형 - 일반적으로 통용되는 코드를 그대로 사용한다 은행코드
001 : 한국은행
002 : 산업은행
003 : 기업은행