이 단계에서는 딕셔너리 애노테이터를 생성하고 이를 기반으로 사전 애노테이션을 수행합니다.
이 단계를 통해서 휴먼 애노테이션 단계를 좀더 수월하게 만들 수 있습니다.

전체 실습은 다음의 순서로 진행됩니다.
• Exercise 01: 프로젝트 생성, 타입 시스템 생성 및 수정
• Exercise 02: 기계 학습용 자료(Training Corpus) 업로드
• Exercise 03: 딕셔너리 애노테티터(Dictionary Annotator) 생성 및 사전 애노테이션(Pre-annotation)
• Exercise 04: 휴먼 애노테이션(Human annotation) 태스크 생성
• Exercise 05: 휴먼 애노테이션(Human annotation)
• Exercise 06: 판결(Adjudication)
• Exercise 07(옵션): 룰 애노테이터(Rule Annotator)

목표

이 단계에서는 다음을 수행합니다.
– 딕셔너리 생성
– 딕셔너리 애노테이터 생성

이 랩을 마치면 딕셔너리 및 딕셔너리 애노테이터를 생성할 수 있습니다.

단계

3.0 제조사에 대한 딕셔너리 생성

1. Asset & Tools > Pre-annotators로 이동합니다.

2. Manage Dictionaries 버튼을 클릭합니다.

3. Create Dictionary 버튼을 클릭하고 딕셔너리 이름으로 manufacturer_dict를 입력합니다. Save 버튼을 눌러 저장합니다.

4. 딕셔너리가 생성된 것이 보일 것입니다. 생성된 딕셔너리의 엔티티 타입(Entity Type)으로 Manufacturer를 선택합니다.

5. 딕셔너리의 내용을 수동으로 입력할 수 있지만 리스트가 많으므로 csv로부터 import 하겠습니다. Upload 버튼을 누릅니다.

5. 팝업 윈도우에서 menufacturer_ko.csv를 선택하고 Upload 버튼을 클릭합니다.

6. 다음 화면처럼 딕셔너리의 데이터가 성공적으로 업로드 되었음을 확인합니다. 만약 데이터를 추가하고 싶다면 Add Entry 버튼을 사용하면 됩니다.

7. model_ko.csv 파일을 사용하여 위 3~6번에서 수행한 방법대로 model_dict를 생성하십시오. 4번 단계에서 엔티티 타입으로 Model을 선택합니다.

3.1 Dictionary Annotator 생성하기

1. Asset & Tools > Pre-annotators로 이동합니다. 두개의 딕셔너리가 생성된 것이 보입니다. 또한 Apply This Pre-annotator 버튼이 활성화 되었을 것입니다. 이 버튼을 클릭합니다.

2. DocSet1과 DocSet2를 선택하고 Run 버튼을 누릅니다.

3. 다음과 같이 작업이 완료될 때 까지 기다리십시오.

세번째 실습을 완료하셨습니다.
다음 실습은 휴먼 애노테이션 (Human Annotation) 입니다.

토론 참가

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.