2022년 IHER 제 6차 전문가 초청 강연회 개최

 

한문교육연구소는 2022년 11월 24일(목) 오후 3시부터 5시까지 단국대학교 죽전캠퍼스 사회과학관 105호에서 ‘인문사회연구소 지원사업 <인공지능 기반 데이터 처리기술을 활용한 한문고전 지식정보 구조화 연구>(한국연구재단)의 6차 전문가 초청 강연회’를 개최하였다.

강연자 야스오카 고이치(교토대) 교수는 <Universal Dependencies와 BERT/RoBERTa 모델을 통한 고전 중국어 정보처리>라는 제목으로 Universal Dependencies라고 불리는 다언어 의존관계 말뭉치를 사용한 자연어 처리 중 품사 태그 부여와 의존관계 분석에 관해 소개하였다. 더불어 현대의 자연어 처리는 그 대부분이 BERT · RoBERTa · DeBERTa 등의 사전학습 모델을 활용하기 때문에 이러한 사전학습 모델에 대한 개요를 소개하였다. 사전학습 데이터로 수작업으로 작성한 四書의 의존문법 말뭉치를 우선 활용하였고, 사전학습을 거친 모델로 禮記 · 十八史略 · 楚辭 · 唐詩三百首 · 佛說阿彌陀經 등의 품사, 의존관계를 자동분석하였을 때 白文 기준 약 80%의 정확도를 보였으며, 이러한 방식으로 의존문법 말뭉치를 확장하고 있음을 밝혔다. 다만 불경과 상고문헌, 백화문문헌은 사용 어휘의 품사 및 의존관계 빈도 등에서 이질성이 두드러져 섣불리 사전학습 데이터로 편입할 수 없으며 오히려 별도의 모델을 작성하는 것이 바람직할 것임도 시사했다.

이번 초청 강연회에는 본 연구소의 김우정 소장과 소속 연구원을 비롯한 10여 명이 참석하였으며 강연자와 구조를 고려하지 않고 의존관계를 분석함으로써 언어횡단성을 높이고 문법구조를 단어 간 링크를 설명한 방법론에 대해 심도 있게 토의하였다.

 

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *