IBM® InfoSphere® Information Server는 데이터 통합 ​​소프트웨어 플랫폼으로 조직 전반에 분산되어 있는 복잡하고 이기종 정보로부터 가치를 창출 할 수 있습니다. InfoSphere Information Server는 회사가 신뢰할 수 있고 상황에 맞는 정보를 이해, 정제, 변환 및 전달할 수 있게 해주는 단일화 된 통합 플랫폼을 제공합니다. 이번 연재에서는 InfoSphere Information Server 내의 정보거버넌스 정책 구축을 위한 핵심 소프트웨어인 InfoSphere Information Governance Catalog 에 대해 소개하고 ,  간단히 정책들을 import 하는 실습에 대해 소개해 보고자 합니다.

1 InfoSphere Information Governance Catalog 알아보기

  1. Information Governance Catalog Overview

IBM InfoSphere Information Governance Catalog는 신뢰할 수 있는 비즈니스 지식을 생성, 관리, 공유, 사용하는 데 활용할 수 있는 대화식 웹 기반 툴로 InfoSphere Information Server 제품군 중의 핵심역량을 담당합니다.                                                                                                        InfoSphere Information Governance Catalog는 사용자가 자산의 비즈니스 의미를 이해하고 검색, 찾아보기 및 쿼리 기능을 제공합니다. 또한 사용자는 자산 수집을 설정하고 계보 보고서를 실행하여 자산 간의 데이터 흐름을 검사 할 수 있습니다.  IBM® InfoSphere® Information Governance Catalog를 사용하여 자산(asset)을 작성할 수 있습니다. 또한 다른 응용 프로그램이나 외부 응용 프로그램에서 가져온 자산(asset)과 해당 메타 데이터를 사용할 수도 있습니다.                                                                                                                                                                             InfoSphere Information Server의 메타 데이터 저장소는 제품에서 작성하거나 가져온 메타 데이터를 저장합니다. 메타 데이터 저장소는 제품별로 작성되거나 가져온 메타 데이터를 하나의 공유 위치에 저장합니다.  데이터는 메타 데이터 레포지토리에 유지되며 제품군 내의 다른 InfoSphere Information Server 제품 및 구성 요소에서 사용할 수 있습니다.                                                                                                           InfoSphere Information Governance Catalog는 용어집 자산의 저장 및 정보 자산의 메타 데이터를 기술하기 위해 “Catalog” 개념을 사용합니다. Catalog 는 메타 데이터 저장소의 subset입니다. 그러나 Catalog 는 메타 데이터 저장소의 물리적 위치가 아닙니다.    Glossary asset들을 InfoSphere Information Governance Catalog에서 작성한 categories, terms, information governance policies 및 information governance rule 입니다. 이러한 자산은 카탈로그에 저장됩니다.   Information assets 은 InfoSphere Metadata Asset Manager, InfoSphere DataStage®, InfoSphere QualityStage 및 InfoSphere Information Analyzer와 같은 InfoSphere Information Server 제품에 의해 작성되거나 가져 오기가 됩니다. Information assets 에는 BI (Business Intelligence) 보고서, 작업 및 매핑 사양과 같은 다양한 자산 유형이 포함될 수 있습니다.                  이러한 자산에 대한 메타 데이터를 카탈로그로 가져올 수 있습니다.

                                                                                < Catalog 의 용어 자산과 정보 자산의 관계 >

 

IBM InfoSphere Information Governance Catalog 카탈로그가 사용하는 메타 데이터 유형은 다음과 같습니다.                                                        비즈니스 메타 데이터(Business metadata) 다른 응용 프로그램에서 만들고 관리하는 자산에 대한 비즈니스 컨텍스트와 비즈니스 이름을 제공합니다.  비즈니스 메타 데이터에는 InfoSphere Information Governance Catalog에서 작성된 용어, 정보 거버넌스 규칙, 레이블 및 Stewardship 가 포함됩니다.

  • 기술 메타 데이터(Technical metadata)

원본 및 대상 시스템, 데이터베이스 테이블 및 필드 구조 및 다음 유형의 자산에 대한 종속성에 대한 세부 정보를 제공합니다.                                  – 호스트 컴퓨터, 데이터베이스, 데이터 파일 및 해당 내용과 같은 구현 된 데이터 리소스                                                                                                  – InfoSphere DataStage® 및 QualityStage® 및 IBM Db2® BLU Acceleration에서 작성된 ETL 프로세스, 프로젝트, 사용자 및 작업                       –  InfoSphere Discovery 및 InfoSphere Information Analyzer의 분석                                                                                                                                      – IBM Cognos® 및 SAP BusinessObjects와 같은 BI 응용 프로그램에서 가져온 InfoSphere Metadata Integration Bridges에서 가져온 BI 보고서 및 모델 메타 데이터

  • 운영 메타 데이터(Operational metadata)
    데이터베이스 테이블 또는 데이터 파일로 영향 받는 job 실행에 대한 메타정보를 관리합니다.  InfoSphere Information Governance Catalog를 사용하여 설계 및 운영 메타 데이터를 결합하는 데이터 계보 보고서를 작성할 수 있습니다.
  1. Information Governance Catalog 특징                                                                                                                                                                    Information Governance Catalog 는 다음의 역활들을 수행할 수 있습니다.
    1)정보 거버넌스 활성화
    – 시맨틱 정책 및 규칙을 통해 거버넌스 요구 사항을 정확하게 전달할 수 있음
    – 공통 언어는 비즈니스 요구 사항에 대한 정보 개발을 간소화함
    – 정보 공급망의 모든 단계에서 Stewardship
    – End-to-end 데이터 계보 및 영향 분석
    2) 지원 책임 및 책임
    – Stewardship 을 단일 연락 창구로 지정함
    – 비즈니스 메타 데이터와 기술 메타 데이터를 연결하여 규정 준수를 보장함
    3) 정보 접근성 향상
    – 관리자는 비즈니스 사용자의 필요에 맞게 이 도구를 조정할 수 있음
    – 필요할 때 필요한 엔터프라이즈 정보에 액세스
    – 공통 시맨틱 허브를 기반으로 정보 자산을 사용하고 재사용
    4) 공동 작업 사용
    – 팀 구성원 간에 주석을 캡처하고 공유
    – 정보의 맥락에 대한 이해
    – 신뢰할 수 있는 정보의 보편적 사용 및 재사용
  2.  Information Governance Catalog 기능                                                                                                                                                    Information Governance Catalog 는 데이터 검색, 자산(asset) 세부 사항 탐색, 자산(asset) 간 관계 분석 및 데이터에서 얻는 통찰력을 학습합니다.                                                                                                                                                                                                                                                     1) Catalog 내에서 자산(asset) 검색                                                                                                                                                                          Catalog 에 있는 모든 유형의 자산을 검색하여 엔터프라이즈에서 정의된 대로 그 의미를 이해하십시오.   Catalog 에서 자산을 검색하여 엔터프라이즈 컨텍스트에서의 의미를 더 잘 이해할 수 있습니다. 검색 결과의 범위를 좁히려면 검색 옵션을 사용하고 기본 설정을 저장할 수 있습니다. 검색 결과를 공유해야 하는 경우 CSV 파일에 저장할 수 있습니다.(1) IGC 시작페이지에서 검색을 원하는 asset type 을 선택합니다. (기본값으로 term 이 선택됩니다)

(2)   Asset 의 이름을 입력하기 시작합니다. 결과는 사용자가 입력 할 때 즉시 표시되고 조정됩니다.

(3) 모든 결과를 보려면 검색 아이콘을 클릭하고, 검색 결과의 범위를 좁히려면 검색 옵션을 지정하십시오

(4) 이후 세션에서 사용하기 위해 검색 환경 설정을 저장하려면, 동작 메뉴에서 검색 옵션 저장을 선택하십시오

(5) 검색 결과를 CSV 파일로 저장하려면 창의 오른쪽 상단에 있는 목록 옵션 메뉴에서 CSV를 선택하십시오.

 

2) Catalog 찾아보기 및 탐색

용어 자산(glossary assets)과 계보 및 information assets을 검색합니다. Catalog 의 자산에 대한 세부 정보를 탐색할 수 있습니다. 카탈로그를 검색할 때 목록 또는 카탈로그 내용의 계층적 트리를 표시 할 수 있습니다. 계층 구조 형식을 사용하면 자산의 의미와 다른 자산과의 관계를 더 잘 이해할 수 있습니다.

(1) 계층 구조 탐색

(A) terms, categories 및 information governance policies 에 대한 계층을 보려면 Catalog > Glossary 을 open 합니다.

B) 용어(term) 유형 계층 구조를 선택하십시오. “Product” 용어에 대한 세부 사항을 표시하려면 계층을 확장하고 용어 이름을 클릭하십시오.

(2)  information assets 에 대한 계층 구조를 보려면 Catalog > Information Assets 을 open 합니다.

 

데이터베이스 테이블을 열어 catalog 에 있는 데이터베이스 테이블을 확인하십시오

 

(3) 데이터 계보 보고서
데이터 계보 보고서를 통하여 데이터의 출처 및 출현 자산을 파악합니다 .

1) 자산의 이름은 모르는 유형 (예- 데이터베이스 테이블)을 모르는 경우에는 Catalog > Information Assets > Browse All > Database Tables 을 열고 자산을 수동으로 찾습니다.  자산 이름을 알고있는 경우에는 검색을 사용하여 자산의 세부 정보 페이지 (예 : WHS_PRODUCT 데이터베이스 테이블)를 open 합니다

2) data lineage 를 OPEN

browse asset type page 에서 계보를 표시할 자산 위로 마우스를 이동하고 계보 표시 아이콘을 클릭합니다

browse asset type page 에서 계보를 표시할 자산 위로 마우스를 이동하고 계보 표시 아이콘을 클릭합니다

Run Lineage 를 클릭합니다.

 

 

(4) 저작물 쿼리
쿼리를 만들어 assets, 해당 속성 및 relationships 를 찾고 나열합니다.    쿼리를 사용하여 관심있는 데이터를 찾습니다. 조건을 지정하면 쿼리 결과를 현재 순간에 중요한 쿼리 결과로 제한 할 수 있습니다

1) Catalog > Queries 를 open 하고, 창의 오른쪽 상단에 있는 메뉴에서 “New” 를 선택하십시오.

2) 결과에 표시 할 속성을 두 번 클릭하거나 속성을 선택하고 화살표를 클릭합니다. 다음 등록 정보를 추가하여 쿼리를 작성합니다.

지금까지 InfoSphere Information Governance Catalog 란 어떤 제품이고 , 어떤 기능들을 제공하지 지에 대해 알아보았다.
다음 연재에서는 이를 기반으로  IGC  용어, 정책 및 거버넌스 규칙의 사전 빌드 된 패키지를 설치하여 정보 거버넌스 작업을 빠르게 시작할 수 있는 방법을 학습하기로 하겠습니다.

InfoSphere Information Governance Catalog 에 대해 더 깊이 이해하고 싶으면 아래 inforcenter 를 참고하십시요.                                https://www.ibm.com/support/knowledgecenter/en/SSZJPZ_11.7.0/com.ibm.swg.im.iis.productization.iisinfsv.home.doc/topics/kc_homepage_IS.html

 

 

토론 참가

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.