[연구] 우홍욱 교수 연구실 (CSI연구실), AAAI 2025 논문 게재 승인
- 소프트웨어학과
- 조회수526
- 2024-12-23
[우홍욱 교수] CSI연구실, AAAI 2025 논문 게재 승인
CSI연구실 (지도교수: 우홍욱)의 논문이 인공지능 분야 우수학회인 AAAI 2025 (The 39th Annual AAAI Conference on Artificial Intelligence)에 게재 승인(Accept) 되었습니다. 논문은 25년 2월 미국 필라델피아에서 발표될 예정입니다.
논문 “In-Context Policy Adaptation Via Cross-Domain Skill Diffusion” 은 소프트웨어학과 유민종 학생 (석박통합과정)이 제1저자로 참여했으며, 김우경 학생 (석박통합과정)이 공저자로 참여했습니다.
본 연구에서는 다양한 도메인에서의 장기(long-horizon) 멀티태스크 환경을 대상으로 하는 In-Context Policy Adaptation (ICPAD) 프레임워크를 제안하며, cross-domain 환경에서 확산(diffusion) 기반의 스킬 학습 기법을 기술합니다. ICPAD는 모델 업데이트 없이 제한된 타겟 도메인 데이터만으로 스킬 기반 강화학습(RL) 정책을 다양한 타겟 도메인으로 빠르게 적응시킬 수 있도록 설계되었습니다. 이를 위해 도메인 불변의 프로토타입 스킬(prototype skills)과 도메인 정합(domain-grounded) 스킬 어댑터를 학습하여, 도메인 간 일관성을 유지하며 정책을 타겟 도메인에 맞게 변환하는 cross-domain 스킬 확산(cross-domain skill diffusion)과 타겟 도메인의 데이터가 제한된 상황에서도, 도메인 정보를 프롬프트로 활용하여 확산 기반 스킬 번역 과정을 최적화하고, 정책을 효과적으로 조정하는 동적 도메인 프롬팅(dynamic domain prompting)을 결합합니다. 실험 결과, ICPAD는 Metaworld(로봇 조작 환경)와 CARLA(자율주행 시뮬레이터)에서 동적 환경 변화 및 다양한 도메인 설정에 대해 기존 최신 기법(SOTA)보다 높은 성능을 달성하였습니다.
CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 연구 등을 수행하고 있습니다. 이번 AAAI 2025 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업, BK21 FOUR 사업(BK21), 정보통신기획평가원, 삼성전자 지원으로 진행 중 입니다.
우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
- 다음글
- 다음글이 없습니다.