이번 글에서는 Watson Knowledge Studio로 머신 러닝 Annotator를 빌드해 봅니다. Watson Knowledge Studio로 빌드한 모델은 Watson Discovery 및 Watson Natural Language Understanding 서비스를 통해서 애플리케이션에서 활용할 수 있습니다.

Watson Knowledge Studio는 IBM Cloud를 통해 제공됩니다. 실습을 위해 IBM Cloud에 가입하고 카드등록을 하십시오. IBM Cloud에 가입하면 기본적으로 Lite Account를 보유하게 됩니다. 이를 통해 기한 제한 없이 256mb의 Cloud Foundry 용량과 Lite 태그가 달린 서비스를 무료로 사용할 수 있습니다. 아쉽게도 Watson Knowledge Studio는 Lite Account로는 사용이 불가능한 서비스로 카드 등록을 통해 계정을 업그래이드해야 사용할 수 있습니다. 카드 등록을 마치면 기본적으로 200$의 크레딧이 무료로 제공되며 Free plan만을 사용하면 과금되지 않습니다.

아래 그림은 IBM Cloud를 통해 제공되는 Watson 서비스 목록입니다. Lite 태그가 달려있는 서비스는 카드등록 없이도 사용할 수 있습니다.

Watson Knowledge Studio의 가격 정책은 3가지가 있는데 그 중 Free plan을 사용 하면 기간 제한 없이 무료로 사용이 가능합니다. 무료 플랜을 사용할 때는, 머신 러닝 모델을 Watson Developer Cloud를 통해 제공되는 Watson Discovery 및 Watson Natural Language Understanding서비스로 디플로이하여 사용하는 것은 가능하지만 Watson Explorer로 Export 하는 것은 불가능 합니다.

IBM Cloud카탈로그에서 Knowledge Studio 서비스를 생성합니다.

서비스를 생성하면 바로 생성된 서비스의 관리 페이지로 이동합니다. 나중에 다시 이 페이지에 접근하려면 IBM Cloud 대시보드에서 Region, Organization, Space를 올바르게 선택하고 해당 서비스를 클릭하면 됩니다.

위 화면에서 Launch Tool버튼을 클릭하여 Knowledge Studio 툴에 접근할 수 있습니다. 툴의 링크를 즐겨찾기 해놓으면 편리하게 접속할 수 있습니다.

이 실습 가이드 시리즈는 IBM Watson Academy의 Watson Knowledge Studio Hands-On 강의의 실습 자료를 기반으로 합니다. 실습을 마치신 후에 Quiz를 풀면 Badge가 발급됩니다. :-)

전체 실습은 다음의 순서로 진행됩니다.
• Exercise 01: 프로젝트 생성, 타입 시스템 생성 및 수정
Exercise 02: 기계 학습용 자료(Training Corpus) 업로드
Exercise 03: 딕셔너리 애노테티터(Dictionary Annotator) 생성 및 사전 애노테이션(Pre-annotation)
Exercise 04: 언어적 규칙(Linguistic Rule)을 사용한 사전 애노테이션(Pre-annotation)
Exercise 05: 휴먼 애노테이션(Human annotation) 태스크 생성
Exercise 06: 휴먼 애노테이션(Human annotation)
Exercise 07: 판결(Adjudication)

사전 준비 사항

1) IBM Cloud 계정 생성 – bluemix.net
2) Watson Knowledge Studio의 웹 인터페이스는 Chrome 및 Firefox에서 잘 동작합니다.
3) 실습에 필요한 파일 다운로드

Exercise 01: 프로젝트 생성, 타입 시스템 생성 및 수정

목표

이 단계에서는 다음을 수행합니다.
– 프로젝트 생성
– 타입 시스템(Type System) Import
– 새로운 엔티티(Entity)와 릴레이션 타입(Relation Type) 추가
이 단계를 마치면 WKS(Watson Knowledge Studio) 툴을 사용하여 타입 시스템을 생성하고 관리할 수 있습니다.

단계

1.1 프로젝트 생성

위에 설명한 WKS 툴에 접속하면 “Projects” 페이지가 열립니다.

Create Project 버튼을 눌러 새 프로젝트를 생성합니다.

팝업에서 프로젝트 이름을 입력하고 언어로 한국어를 선택하십시오. 프로젝트 설명(Description)은 선택 입력 사항입니다. Advanced Options에서 Tokenizer를 선택합니다. Dictionary based Tokenizer를 선택할 수도 있지만 이 실습에서는 Default Tokenizer를 선택합니다.

Create 버튼을 누르면 프로젝트가 생성되고 프로젝트 창으로 이동됩니다. Type System이 보여질 것입니다.

1.2 타입 시스템 가져오기

배부된 파일 중에 TIRTypeSystem.json 파일이 타입 시스템을 정의한 파일입니다. 이 파일을 열어 확인해 보십시오. 3개의 엔티티 타입과 1개의 관계 타입을 포함하고 있습니다.

타입 시스템 페이지에서 Upload를 선택합니다. TIRTypeSystem.json 파일을 선택하고 Upload 버튼을 클릭합니다.

타입 시스템 페이지에 3개의 엔티티 타입과 1개의 관계 타입이 추가된 것을 확인하십시오.

1.3 타입 시스템 수정하기

다음의 엔티티 타입을 추가하십시오.
– Vehicle
– Incident
– Person
– Carpart

추가하는 방법은 다음과 같습니다.

1) 타입 시스템 페이지에서 “Add Entity Type”을 클릭합니다.
2) 엔티티 타입 이름으로 “Vehicle”을 입력하고 엔터키를 누루십시오. 같은 방법으로 나머지 엔티티인 Incident, Person, Carpart도 추가합니다.
3) Model 타입과 Manufacturer 타입을 수정하여 “Vehicle” 롤을 모두 추가합니다. 엔티티 타입을 수정하려면 수정하려는 타입 행의 “Edit” 버튼을 클릭합니다. Select a role 드롭다운 메뉴에서 Vehicle을 선택하고 Save 버튼을 누릅니다.
4) 이 과정을 마치면 아래 화면처럼 바뀌었을 것입니다.

좌측 탭에서 Relation Types 탭을 눌러 이동하신 후 다음의 관계 타입을 추가하십시오.
– locatedOn(Carpart, Vehicle)
– occupantOf(Person, Vehicle)

추가하는 방법은 다음과 같습니다.

1) Add Relation Type 버튼을 클릭합니다.
2) Relation Type 이름으로 locateOn을 입력하고 첫번째 엔티티로 Carpart를, 두번째 엔티티로 Vehicle을 선택합니다.
3) 같은 방법으로 occupantOf 관계 타입을 추가하고 첫번째 엔티티로 Person을, 두번째 엔티티로 Vehicle을 선택합니다.
4) manufacturer 와 model 사이의 관계 타입은 삭제하십시오.
5) 이 과정까지 마치면 아래 화면처럼 되었을 것입니다.

프로젝트 생성 및 타입시스템 관리에 대한 실습을 마쳤습니다.

다음 실습은 Exercise 02: 기계 학습용 자료(Training Corpus) 업로드 입니다.

2 개의 댓글"Watson Knowledge Studio로 텍스트 분석을 위한 머신 러닝 Annotator 빌드하기 실습 – 1. 프로젝트 생성 및 타입 시스템 관리"

  1. kim ki youn 2월 19, 2018

    항상 좋은 실습 자료 올려주셔서 감사합니다.
    보안 문제로 실습에 필요한 파일에 접근이 안되는데 해결 할수 있는 방법이 없을까요? (회사 내에서 파일 공유 site 접근 불가)

토론 참가

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다