이 λ‹¨κ³„μ—μ„œλŠ” λ”•μ…”λ„ˆλ¦¬ μ• λ…Έν…Œμ΄ν„°λ₯Ό μƒμ„±ν•˜κ³  이λ₯Ό 기반으둜 사전 μ• λ…Έν…Œμ΄μ…˜μ„ μˆ˜ν–‰ν•©λ‹ˆλ‹€.
이 단계λ₯Ό ν†΅ν•΄μ„œ 휴먼 μ• λ…Έν…Œμ΄μ…˜ 단계λ₯Ό 쒀더 μˆ˜μ›”ν•˜κ²Œ λ§Œλ“€ 수 μžˆμŠ΅λ‹ˆλ‹€.

전체 μ‹€μŠ΅μ€ λ‹€μŒμ˜ μˆœμ„œλ‘œ μ§„ν–‰λ©λ‹ˆλ‹€.
β€’ Exercise 01: ν”„λ‘œμ νŠΈ 생성, νƒ€μž… μ‹œμŠ€ν…œ 생성 및 μˆ˜μ •
β€’ Exercise 02: 기계 ν•™μŠ΅μš© 자료(Training Corpus) μ—…λ‘œλ“œ
β€’ Exercise 03: λ”•μ…”λ„ˆλ¦¬ μ• λ…Έν…Œν‹°ν„°(Dictionary Annotator) 생성 및 사전 μ• λ…Έν…Œμ΄μ…˜(Pre-annotation)
β€’ Exercise 04: 언어적 κ·œμΉ™(Linguistic Rule)을 μ‚¬μš©ν•œ 사전 μ• λ…Έν…Œμ΄μ…˜(Pre-annotation)
β€’ Exercise 05: 휴먼 μ• λ…Έν…Œμ΄μ…˜(Human annotation) νƒœμŠ€ν¬ 생성
β€’ Exercise 06: 휴먼 μ• λ…Έν…Œμ΄μ…˜(Human annotation)
β€’ Exercise 07: 판결(Adjudication)

λͺ©ν‘œ

이 λ‹¨κ³„μ—μ„œλŠ” λ‹€μŒμ„ μˆ˜ν–‰ν•©λ‹ˆλ‹€.
– λ”•μ…”λ„ˆλ¦¬ 생성
– λ”•μ…”λ„ˆλ¦¬ μ• λ…Έν…Œμ΄ν„° 생성
– 사전 μ• λ…Έν…Œμ΄μ…˜ (Pre-Annotation)

이 λž©μ„ 마치면 λ”•μ…”λ„ˆλ¦¬ 및 λ”•μ…”λ„ˆλ¦¬ μ• λ…Έν…Œμ΄ν„°λ₯Ό 생성할 수 μžˆμŠ΅λ‹ˆλ‹€.

단계

3.0 μ œμ‘°μ‚¬μ— λŒ€ν•œ λ”•μ…”λ„ˆλ¦¬ 생성

1. Asset & Tools > Pre-annotators둜 μ΄λ™ν•©λ‹ˆλ‹€.

2. Manage Dictionaries λ²„νŠΌμ„ ν΄λ¦­ν•©λ‹ˆλ‹€.

3. Create Dictionary λ²„νŠΌμ„ ν΄λ¦­ν•˜κ³  λ”•μ…”λ„ˆλ¦¬ μ΄λ¦„μœΌλ‘œ manufacturer_dictλ₯Ό μž…λ ₯ν•©λ‹ˆλ‹€. Save λ²„νŠΌμ„ 눌러 μ €μž₯ν•©λ‹ˆλ‹€.

4. λ”•μ…”λ„ˆλ¦¬κ°€ μƒμ„±λœ 것이 보일 κ²ƒμž…λ‹ˆλ‹€. μƒμ„±λœ λ”•μ…”λ„ˆλ¦¬μ˜ μ—”ν‹°ν‹° νƒ€μž…(Entity Type)으둜 Manufacturerλ₯Ό μ„ νƒν•©λ‹ˆλ‹€.

5. λ”•μ…”λ„ˆλ¦¬μ˜ λ‚΄μš©μ„ μˆ˜λ™μœΌλ‘œ μž…λ ₯ν•  수 μžˆμ§€λ§Œ λ¦¬μŠ€νŠΈκ°€ λ§ŽμœΌλ―€λ‘œ csvλ‘œλΆ€ν„° import ν•˜κ² μŠ΅λ‹ˆλ‹€. Upload λ²„νŠΌμ„ λˆ„λ¦…λ‹ˆλ‹€.

5. νŒμ—… μœˆλ„μš°μ—μ„œ menufacturer_ko.csvλ₯Ό μ„ νƒν•˜κ³  Upload λ²„νŠΌμ„ ν΄λ¦­ν•©λ‹ˆλ‹€.

6. λ‹€μŒ ν™”λ©΄μ²˜λŸΌ λ”•μ…”λ„ˆλ¦¬μ˜ 데이터가 μ„±κ³΅μ μœΌλ‘œ μ—…λ‘œλ“œ λ˜μ—ˆμŒμ„ ν™•μΈν•©λ‹ˆλ‹€. λ§Œμ•½ 데이터λ₯Ό μΆ”κ°€ν•˜κ³  μ‹Άλ‹€λ©΄ Add Entry λ²„νŠΌμ„ μ‚¬μš©ν•˜λ©΄ λ©λ‹ˆλ‹€.

7. model_ko.csv νŒŒμΌμ„ μ‚¬μš©ν•˜μ—¬ μœ„ 3~6λ²ˆμ—μ„œ μˆ˜ν–‰ν•œ λ°©λ²•λŒ€λ‘œ model_dictλ₯Ό μƒμ„±ν•˜μ‹­μ‹œμ˜€. 4번 λ‹¨κ³„μ—μ„œ μ—”ν‹°ν‹° νƒ€μž…μœΌλ‘œ Model을 μ„ νƒν•©λ‹ˆλ‹€.

3.1 Dictionary Annotator μƒμ„±ν•˜κΈ°

1. Asset & Tools > Pre-annotators둜 μ΄λ™ν•©λ‹ˆλ‹€. λ‘κ°œμ˜ λ”•μ…”λ„ˆλ¦¬κ°€ μƒμ„±λœ 것이 λ³΄μž…λ‹ˆλ‹€. λ˜ν•œ Apply This Pre-annotator λ²„νŠΌμ΄ ν™œμ„±ν™” λ˜μ—ˆμ„ κ²ƒμž…λ‹ˆλ‹€. 이 λ²„νŠΌμ„ ν΄λ¦­ν•©λ‹ˆλ‹€.

2. DocSet1κ³Ό DocSet2λ₯Ό μ„ νƒν•˜κ³  Run λ²„νŠΌμ„ λˆ„λ¦…λ‹ˆλ‹€.

3. λ‹€μŒκ³Ό 같이 μž‘μ—…μ΄ μ™„λ£Œλ  λ•Œ κΉŒμ§€ κΈ°λ‹€λ¦¬μ‹­μ‹œμ˜€.

μ„Έλ²ˆμ§Έ μ‹€μŠ΅μ„ μ™„λ£Œν•˜μ…¨μŠ΅λ‹ˆλ‹€.
λ‹€μŒ μ‹€μŠ΅μ€ 휴먼 μ• λ…Έν…Œμ΄μ…˜ (Human Annotation) μž…λ‹ˆλ‹€.

ν† λ‘  μ°Έκ°€

이메일은 κ³΅κ°œλ˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. ν•„μˆ˜ μž…λ ₯창은 * 둜 ν‘œμ‹œλ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€