
강원대학교 원주캠퍼스 컴퓨터공학과 김병욱 교수, 양영욱 교수(교신저자)가 참여한 연구 논문이 데이터베이스 분야의 권위 있는 국제 학술대회인 DASFAA 2026 (The 31st International Conference on Database Systems for Advanced Applications)에 게재 승인되었다. DASFAA는 한국연구재단 BK21 지정 우수학술대회로 인정받는 저명한 국제 학술대회이다.
본 연구는 강원대학교 춘천캠퍼스 데이터사이언스 학과 유재건 대학원생(석사)을 제1저자로 하여 강원대학교 원주캠퍼스 컴퓨터공학과 김병욱 교수, 양영욱 교수(교신저자), 강원대학교 춘천캠퍼스 데이터사이언스학과 장홍준 교수(교신저자)가 참여하였다.
게재 논문 제목은 "LIGRAM: Linguistically Informed Graph Model and Semantic Contrastive Learning for Korean Short Text Classification" 이며, 한국어 특유의 언어적 특성을 반영하여 문맥이 부족한 단문 분류 성능을 획기적으로 향상시킨 연구이다.
이번 연구에서 제안된 LIGRAM은 한국어 단문 분류의 한계를 극복하기 위한 계층적 이종 그래프 모델로, 한국어의 언어적 특성과 짧은 텍스트의 희소한 문맥 정보를 효과적으로 처리하도록 설계되었습니다. 한국어의 교착어적 특성과 빈번한 조사 및 어미의 생략 문제를 해결하기 위해 형태소, 품사, 개체명 등 세 가지 수준의 하위 그래프를 독립적으로 구축하고 이를 계층적으로 통합하여 정밀한 문법적·의미적 의존 관계를 포착하도록 했다. 특히 본 연구에서는 의미 인식 대조 학습인 SemCon 기술을 도입하여 문서 간의 잠재적인 토픽 분포를 기반으로 유사성을 측정함으로써, 문맥이 부족한 단문에서도 클래스 간의 경계를 명확히 구분할 수 있도록 모델의 변별력을 높였다. 실험 결과 LIGRAM은 KLUE YNAT, 네이버 영화 리뷰 등 주요 한국어 단문 데이터셋에서 기존 최신 모델들을 일관되게 압도하는 성과를 보였으며, 특히 YNAT 데이터셋에서는 기존 최고 모델 대비 정확도를 약 23% 가량 끌어올리는 혁신적인 성능 향상을 입증하였다.
강원대학교 데이터사이언스학과 KIND 연구실은 이번 연구 성과를 바탕으로 데이터사이언스 및 AI 분야의 다양한 후속 연구를 진행하고 있으며, 연구에 함께 참여할 (예비) 석·박사 과정 학생을 모집하고 있다. 관심 있는 학생은 연구실 홈페이지(https://sites.google.com/view/kind-lab/home)를 참고하거나 춘천캠퍼스 장홍준 교수(hongjunjang@kangwon.ac.kr) 혹은 원주캠퍼스 양영욱 교수 (yeongwook.yang@kangwon.ac.kr) 이메일로 문의하면 된다.