[연구] 우홍욱 교수 연구실 (CSI연구실), NeurIPS 2025 논문 3편 게재 승인
- 소프트웨어학과
- 조회수1107
- 2025-10-01
우홍욱 교수 연구실 (CSI연구실), NeurIPS 2025 논문 3편 게재 승인
CSI연구실 (지도교수: 우홍욱)의 논문이 인공지능 분야 우수학회인 NeurIPS2025 (The Thirty-Ninth Annual Conference on Neural Information Processing Systems)에 3편 (Spotlight 2편 포함) 논문이 게재 승인(Accept) 되었습니다. 논문은 25년 12월 샌디에고 샌디에고 컨벤션 센터에서 발표될 예정입니다.
1. 논문 “Policy Compatible Skill Incremental Learning via Lazy Learning Interface”은 소프트웨어학과 이대희(석박통합과정), 곽태윤(학사과정), 최원제(박사과정) 연구원이 저자로 참여했습니다. (Spotlight ; top 3.2%)
본 연구에서는 로봇과 인공지능 에이전트가 새로운 스킬을 학습하면서도 기존 정책과의 호환성을 유지하는 스킬 증분 학습(Skill Incremental Learning; SIL) 문제를 다루었습니다. 특히 진화하는 스킬 레퍼토리(evolving skill repertoire) 속에서도 기존 정책의 재학습 없이 신규 스킬을 활용할 수 있도록 하여, 장기적·지속적 학습의 안정성과 효율성을 동시에 달성하는 것을 목표로 합니다.
SIL-C는 Lazy Learning(지연 학습) 기반 인터페이스를 통해 고수준 정책이 제시한 하위 과업(subtask)을 적절한 스킬과 동적으로 연결하는 방식을 제안합니다. 이 과정에서 스킬 검증(skill validation)과 스킬 후킹(skill hooking) 메커니즘을 활용하여 기존 정책과 새롭게 학습된 스킬 간 불일치를 최소화합니다. Franka Kitchen과 Meta-World 등 다양한 시뮬레이션 환경 실험 결과, SIL-C는 기존 방법 대비 Backward(과거 정책이 새로운 스킬을 활용) 및 Forward(새로운 스킬이 미래 정책에 활용) 호환성을 모두 확보했습니다. 특히 제한된 시연(few-shot) 상황에서도 성능을 최대 두 배 가까이 향상시켜, 지속적 학습 환경에서도 효율적이고 강건한 정책 실행이 가능함을 입증했습니다.

2. 논문 “Towards Reliable Code-as-Policies: A Neuro-Symbolic Framework for Embodied Task Planning” 은 소프트웨어학과 안상현 (석사과정), 최원제 (박사과정), 이준용 (학사과정), 인공지능학과 박진우 (석사과정) 연구원이 저자로 참여했습니다. (Spotlight ; top 3.2%)
본 연구에서는 로봇이 부분관찰 환경에서도 신뢰성 있는 정책 코드를 생성할 수 있도록 하는 신경-심볼릭(Neuro-symbolic) 프레임워크 NeSyRo를 제안했습니다. 기존 Code-as-Policies(CaP) 방식의 환경적합성(grounding) 문제를 해결하여, 동적 환경에서도 안정적 정책 실행을 가능하게 하는 것이 목표입니다.
NeSyRo는 verification과 validation단계를 재귀적으로 결합해 코드의 논리적 타당성과 환경 실행 가능성을 모두 확보합니다. 또한 Neuro-Symbolic Confidence (NeSyConf)를 통해 스킬의 실행 가능성을 평가하고, 낮을 경우 재귀적으로 안전한 탐색(Safe Probe)을 생성하여 누락된 관찰을 보완합니다.
RLBench 및 실제 로봇 실험 결과, NeSyRo는 기존 방법 대비 성공률 46.2% 향상, 실행 가능성 86.8% 이상을 달성했습니다. 또한 장기 과제에서도 기존 접근법이 10% 이하에 머무는 반면 52.5% 성공률을 기록하며, 비가역적 실패를 크게 줄였습니다. 특히 잠긴 서랍이나 어두운 방과 같은 불완전 관찰 상황에서도 안전 탐색으로 관찰을 보완하고 정책 코드를 보정하여, 강건하고 신뢰성 있는 장기 로봇 계획을 입증했습니다.

3. 논문 “NeSyPr: Neurosymbolic Proceduralization For Efficient Embodied Reasoning” 은 소프트웨어학과 최원제 (박사과정), 김주영 (석사과정) 연구원이 저자로 참여했습니다.
본 연구는 언어모델 기반의 에이전트가 외부 심볼릭 도구 없이도 구조적이고 적응적인 추론을 수행할 수 있도록 하는 NeSyPr (Neurosymbolic Proceduralization) 프레임워크를 제안합니다.
이 연구는 인간의 지식 절차화(proceduralization) 과정을 모방하여, 심볼릭 도구가 산출한 행동 계획을 언어모델이 활용할 수 있는 절차적 기억으로 변환함으로써 외부 도구 없이도 효율적인 추론을 가능하게 합니다. 학습 단계에서는 심볼릭 도구의 지식을 절차 메모리로 변환 및 축적하고, 실행 단계에서는 이를 뉴럴 네트워크 기반의 언어 모델과 통합하여 빠르고 일반화된 추론을 수행합니다. 실행 중, 환경에서의 성공과 실패 경험을 지속적으로 절차 기억에 축적하고 이를 비교·대조함으로써, 에이전트가 올바른 절차를 강화하고 잘못된 절차는 억제하여 새로운 상황에도 유연하게 적응합니다.
NeSyPr은 PDDLGym, VirtualHome, ALFWorld 세 가지 벤치마크에서 평가되었으며, 기존 대규모 추론 모델과 비교했을 때는 훨씬 작은 언어모델로도 더 높은 성공률과 짧은 지연 시간을 달성했고, 심볼릭 플래너와 비교했을 때는 새로운 환경 변화에 훨씬 더 잘 적응하는 성능을 보여주었습니다.

CSI 연구실은 Embodied Agent, Reinforcement Learning, Self-Learning 기술을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 연구 등을 수행하고 있습니다.
우홍욱 | hwoo@skku.edu | CSI Lab | https://csiagentgroup.com
발전기금



