[연구] [황성재 교수] SoftSec 연구실, EMNLP 2024 논문 게재 승인
- 소프트웨어학과
- 조회수672
- 2024-09-27
[황성재 교수] SoftSec 연구실, EMNLP 2024 논문 게재 승인
SoftSec 연구실 (지도교수 황성재, softsec.skku.edu)의 김준형 학생 (소프트웨어학과 석사과정)의 논문 1편이 자연어 처리 분야의 Top-tier 학술대회인 Conference on Empirical Methods in Natural Language Processing 2024 (EMNLP 2024)에 게재 승인되어 2024년 11월에 발표될 예정입니다.
논문 제목 : “All You Need is Attention: Lightweight Attention-based Data Augmentation for Text Classification”
본 연구에서는 텍스트 분류 모델의 성능을 향상하기 위한 새로운 DA (Data Augmentation) 방법인 LADAM (Lightweight Attention-based Data Augmentation Method)을 제안하였습니다. LADAM은 어텐션 메커니즘을 사용하여 문장 간에 의미상으로 유사한 단어를 교환하는 방식으로, 기존에 존재하는 랜덤 삽입/삭제와 같은 단순한 오퍼레이션 기반의 방법론보다 더 다양하고 원래 문장의 문맥이 유지되는 데이터를 생성합니다. 또한, 기존 DA 방법론과 달리 외부 데이터나 대규모 언어 모델을 필요로 하지 않기 때문에, 성능이 빠르며 사용자가 사용하기 용이합니다. 본 연구에서 LADAM을 다양한 데이터셋에 적용하여 실험해 본 결과, 여러 조건에서 기존의 방법론보다 높은 성능을 보였습니다.
Abstract:
This paper introduces LADAM, a novel method for enhancing the performance of text classification tasks. LADAM employs attention mechanisms to exchange semantically similar words between sentences. This approach generates a greater diversity of synthetic sentences compared to simpler operations like random insertions, while maintaining the context of the original sentences. Additionally, LADAM is an easy-to-use, lightweight technique that does not require external datasets or large language models. Our experimental results across five datasets demonstrate that LADAM consistently outperforms baseline methods across diverse conditions.