-
- [일반] [SKKU People] 도전과 은혜의 흘려보내기 (소프트웨어학과 이지형 교수)
- 도전과 은혜의 흘려보내기 (소프트웨어학과 이지형 교수)
-
- 작성일 2024-05-21
- 조회수 174
-
- [연구] [박진영 교수] HLI연구실, ICML 2024 논문 게재 승인
- HLI연구실 (지도교수: 박진영)의 박상준 학생의 논문이 인공지능 학회 ICML 2024(The Forty-first International Conference on Machine Learning) 에 게재 승인(Accept) 되었습니다. 해당 논문은 24년 7월 오스트리아 비엔나에서 발표될 예정입니다. 본 연구 "Memoria: Resolving Fateful Forgetting Problem through Human-Inspired Memory Architecture"는 인공지능 모델을 위한 기억 시스템을 제안합니다. 인공신경망이 장기기억을 갖도록 만드는 것은 오랜 문제이며 외부 기억을 활용하는 다양한 기법이 등장했지만, 대부분 최근 정보를 단기적으로 보존하는 것에 초점을 맞추었습니다. Memoria는 인간의 뛰어난 기억 시스템에서 영감을 받아 다양한 심리학과 신경과학적 이론을 바탕으로 설계되었습니다. 실험결과는 Memoria가 정렬, 언어 모델링 및 분류와 같은 다양한 작업에서 뛰어난 성능을 보임을 입증합니다. 또한 Memoria의 기억을 분석하여 Memoria에서 인간 기억의 특성인 초두효과(primacy effect), 최신효과(recency effect) 및 시간 연속성 효과(temporal contiguity effect)가 나타남을 보였습니다.
-
- 작성일 2024-05-17
- 조회수 1573
-
- [연구] [우홍욱 교수] CSI연구실, ICML 2024 논문 게재 승인
- [우홍욱 교수] CSI연구실, ICML 2024 논문 게재 승인 CSI연구실 (지도교수: 우홍욱)의 논문이 인공지능 분야 우수학회인 ICML 2024 (The Forty-first International Conference on Machine Learning) 에 게재 승인(Accept) 되었습니다. 논문은 24년 7월 오스트리아 비엔나에서 발표될 예정입니다. 논문 “Embodied CoT Distillation From LLM To Off-the-shelf Agents” 은 소프트웨어학과 최원제 (박사과정), 김우경 (박사과정), 유민종 (석박사통합과정) 연구원이 저자로 참여했습니다. 본 연구는 로봇이나 자율주행 차량과 같은 임바디드 (Embodied) 인공지능 에이전트를 위한 초거대언어모델 (LLM) 기반 정책 학습 (Policy Learning) 프레임워크 DEDER 를 제시합니다. DEDER를 통해 LLM의 임바디드 추론 능력을 CoT (Chain of Thoughts) 단계별로 분해하고 (Decomposition), 추출하여 (Distillation), 제한된 리소스를 갖는 off-the-shelf 디바이스와 소형 언어모델 (sLM)만을 사용하는 효율적인 에이전트 정책으로 재구성합니다. 본 연구에서는 DEDER를 통해 개발한 에이전트 정책이 임바디드 에이전트 시뮬레이션 환경인 ALFRED에서 다양한 제한된 리소스 조건과 태스크 시나리오에 대해 높은 성능을 내는 것을 확인했습니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 연구 등을 수행하고 있습니다. 이번 ICML 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업, 삼성전자의 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2024-05-16
- 조회수 1684
-
- [일반] 우즈베키스탄에서 온 Daler 학우 (소프트웨어학과 22학번)
- 우즈베키스탄에서 온 Daler 학우 (소프트웨어학과 22학번)
-
- 작성일 2024-05-13
- 조회수 219
-
- [연구] [우홍욱 교수] CSI연구실, IJCAI 2024 논문 게재 승인
- [우홍욱 교수] CSI연구실, IJCAI 2024 논문 게재 승인 CSI연구실 (지도교수: 우홍욱)의 논문 2편이 인공지능 분야 우수학회인 IJCAI 2024 (the 33rd International Joint Conference on Artificial Intelligence) 에 게재 승인(Accept) 되었습니다. 논문은 24년 8월 제주에서 발표될 예정이다. 논문 “Offline Policy Learning Via Skill-step Abstraction For Long-Horizon Goal-Conditioned Tasks” 은 김동훈 (인공지능학과 석사졸업), 유민종 (소프트웨어학과 석박사통합과정) 연구원이 저자로 참여했습니다. 논문 “Pareto Inverse Reinforcement Learning for Diverse Expert Policy Generation” 은 김우경 (소프트웨어학과 박사과정), 유민종 (소프트웨어학과 석박사통합과정) 연구원이 저자로 참여했습니다. 1. Offline Policy Learning Via Skill-step Abstraction For Long-Horizon Goal-Conditioned Tasks 본 연구는 로봇이나 자율주행과 같은 자동화/지능형 에이전트 개발에 활용되는 목적 조건 강화학습 정책 학습 (Goal-Conditioned Policy Learning) 기법의 기존 제한점인 Long-horizon 태스크 (장기 목적 구조에 따라 보상 시그널이 적어서 학습이 어려운 경우)를 해결하는 효율적인 스킬 기반 정책 학습 (Skill-based Goal-Conditioned Policy Learning) 프레임워크를 제안합니다. 로봇 스킬은 오프라인 데이터셋에서부터 학습되며, 이러한 오프라인 학습 과정에서 스킬 수준의 추상화된 환경 모델 (Skill-step Abstract)과 목적 조건 정책을 동시에 반복 학습하여 정책의 성능을 높입니다. 또한, 프레임워크는 정책 네트워크 구조를 모듈화하여, 오프라인에서 학습된 환경 모델과의 차이가 발생하는 실제 타켓 환경에 빠른 적응이 가능한 파라미터 효율적인 학습 구조를 지원합니다. 2. Pareto Inverse Reinforcement Learning for Diverse Expert Policy Generation 최근 데이터 기반의 오프라인 강화학습과 모방학습이 순차적 의사 결정 문제에 대응하는 데 인기를 얻은 반면, 이러한 접근 기술은 제한된 전문가 데이터셋이 주어질 때, 파레토 최적 정책 (Pareto-optimal Policy set : 다중 목적 함수에 대한 최적 정책들)을 학습하는 것을 고려하지는 않았습니다. 본 연구에서는 역강화학습 (IRL, Inverse Reinforcement Learning)을 적용하여 각 전문가가 다른 최적화 선호도를 가지는 다중 목적에 대한 정책 집합을 점진적으로 생성하는 ParIRL 프레임워크를 제안합니다. ParIRL은 CARLA 자율주행과 같은 다양한 다중 목적 제어 작업에서 SOTA IRL 알고리즘 보다 높은 성능을 내는 것을 실험을 통해 입증하였습니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 연구 등을 수행하고 있습니다. 이번 IJCAI 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업, 삼성전자 삼성리서치의 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2024-05-02
- 조회수 1868
-
- [연구] [차수영 교수] 소프트웨어분석 연구실, FSE 2024 논문 게재 승인
- 소프트웨어 분석 연구실 (지도교수: 차수영)의 윤재한 학생 (석사과정)의 논문이 소프트웨어공학 분야 최우수 학회 (IF=4)인 FSE 2024 (ACM International Conference on the Foundations of Software Engineering)에 게재 승인(Accept) 되었습니다. 해당 논문은 2024년 7월에 브라질 Porto de Galinhas에서 발표될 예정입니다. 본 논문 "FeatMaker: Automated Feature Engineering for Search Strategy of Symbolic Execution"에서 탐색전략(Search strategy)은 테스팅을 수행하는 동안 오류 검출을 위해 우선적으로 탐험할 프로그램 상태(Program state)를 선택하는 기술이다. 기존 탐색전략들은 탐험할 프로그램 상태들을 구분하기 위해 각자의 피처(feature)들을 수작업으로 고안하였지만, 이 손수 고안된 피처들은 테스팅 성능을 효과적으로 높이는데 실패하였다. 본 논문에서는 프로그램 상태를 기술하는 피처들을 자동으로 고안하여 테스팅의 효과성을 높이는 FeatMaker를 제안한다. 실험적으로, FeatMaker는 다수의 오픈소스-C 프로그램들에 대해 수작업으로 고안된 탐색 전략들보다 약 35% 많은 코드 영역을 커버했으며 기존 전략들은 검출하지 못한 6개의 오류를 찾을 수 있었다. [논문 정보] - 제목: FeatMaker: Automated Feature Engineering for Search Strategy of Symbolic Execution - 저자: 윤재한, 차수영 - 학회: ACM International Conference on the Foundations of Software Engineering (FSE 2024) Abstract: We present FeatMaker, a novel technique that automatically generates state features to enhance the search strategy of symbolic execution. Search strategies, designed to address the well-known state-explosion problem, prioritize which program states to explore. These strategies typically depend on a "state feature" that describes a specific property of program states, using this feature to score and rank them. Recently, search strategies employing multiple state features have shown superior performance over traditional strategies that use a single, generic feature. However, the process of designing these features remains largely manual. Moreover, manually crafting state features is both time-consuming and prone to yielding unsatisfactory results. The goal of this paper is to fully automate the process of generating state features for search strategies from scratch. The key idea is to leverage path-conditions, which are basic but vital information maintained by symbolic execution, as state features. A challenge arises when employing all path-conditions as state features, as it results in an excessive number of state features. To address this, we present a specialized algorithm that iteratively generates and refines state features based on data accumulated during symbolic execution. Experimental results on 15 open-source C programs show that FeatMaker significantly outperforms existing search strategies that rely on manually-designed features, both in terms of branch coverage and bug detection. Notably, FeatMaker achieved an average of 35.3% higher branch coverage than state-of-the-art strategies and discovered 15 unique bugs. Of these, six were detected exclusively by FeatMaker.
-
- 작성일 2024-04-17
- 조회수 1753
-
- [연구] [이지형 교수] 정보 및 지능 시스템 연구실, CVPR 2024 논문 1편 게재 승인
- [이지형 교수] 정보 및 지능 시스템 연구실, CVPR 2024 논문 1편 게재 승인 정보 및 지능 시스템 연구실(지도교수:이지형)의 논문 1편이 컴퓨터 비전 및 인공지능 분야의 최우수 국제 학술대회(BK21 CS IF=4)인 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2024)에 게재 승인되었다. 제목 : "Learning with Structural Labels for Learning with Noisy Labels" (전자전기컴퓨터공학과 박사 김누리*, 인공지능학과 석박통합과정 이진섭*) (*공동 1저자) "Learning with Structural Labels for Learning with Noisy Labels" 논문에서는 학습 데이터의 레이블이 잘못 주어진 환경인 Noisy Labels 환경에서 딥러닝 모델 학습을 위한 방법을 제안합니다. 기존 방법들이 학습하고 있는 모델 자신의 출력 결과에만 크게 의존하여, 학습에 사용할 샘플을 선별하거나 레이블을 수정하고 있기 때문에 발생하는 문제를 제기하고, 이를 해결하기 위한 방법을 제시합니다. 해당 논문에서는 모델 자신의 출력 결과뿐만 아니라, Noisy한 상황에서 데이터 분포를 효과적으로 반영하기 위해 Reverse k-NN을 활용하여 Structural Label을 추출하였으며, 이를 모델이 추가적으로 학습하도록 하였습니다. 제안 방법은 벤치마크 데이터셋을 비롯한 real-world 노이즈 데이터셋에 대하여 우수한 성능을 보입니다. [논문 정보] Learning with Structural Labels for Learning with Noisy Labels Noo-ri Kim*, Jin-Seop Lee*, Jee-Hyong Lee IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2024 Abstract: Deep Neural Networks (DNNs) have demonstrated remarkable performance across diverse domains and tasks with large-scale datasets. To reduce labeling costs for large-scale datasets, semi-automated and crowdsourcing labeling methods are developed, but their labels are inevitably noisy. Learning with Noisy Labels (LNL) approaches aim to train DNNs despite the presence of noisy labels. These approaches utilize the memorization effect to select correct labels and refine noisy ones, which are then used for subsequent training. However, these methods encounter a significant decrease in the model's generalization performance due to the inevitably existing noise labels. To overcome this limitation, we propose a new approach to enhance learning with noisy labels by incorporating additional distribution information—structural labels. In order to leverage additional distribution information for generalization, we employ a reverse k-NN, which helps the model in achieving a better feature manifold and mitigating overfitting to noisy labels. The proposed method shows outperformed performance in multiple benchmark datasets with IDN and real-world noisy datasets.
-
- 작성일 2024-04-03
- 조회수 2145
-
- [연구] [이지형 교수] 정보 및 지능 시스템 연구실, LREC-COLING 2024 논문 2편 게재 승인
- 정보 및 지능 시스템 연구실(지도교수: 이지형)의 논문 2편이 자연어 처리 분야 저명한 국제 학술대회 LREC-COLING (BK IF=2) “The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING ’24)”에 게재 승인되었습니다. 논문 #1: “STAGE: Simple Text Data Augmentation by Graph Exploration”, LREC-COLING 2024 (인공지능학과 박사과정 김호승, 인공지능학과 박사과정 강용훈) "STAGE: Simple Text Data Augmentation by Graph Exploration" 논문에서는 텍스트 데이터를 그래프로 변환하고 이를 활용한 데이터 증강(Data Augmentation)하는 방법을 제안합니다. 기존 방법론은 복잡성, 비용, 그리고 성능에 대해서 조금 더 나은 해결방안이 필요 되어집니다. 우리의 STAGE(Simple Text Data Augmentation)는 공동 그래프(Co-graph)를 활용한 최적의 수정될 단어를 선택합니다. 수정된 단어를 Delete, replace, insert, swap 방법을 사용하여 문장을 증가시키는데, 이 방법은 기존보다 복잡함과 비용은 줄이고 더 나은 성능을 보입니다. [Abstract] Pre-trained language models (PLMs) are widely used for various tasks, but fine-tuning them requires sufficient data. Data augmentation approaches have been proposed as alternatives, but they vary in complexity, cost, and performance. To address these challenges, we propose STAGE (Simple Text Data Augmentation by Graph Exploration), a highly effective method for data augmentation. STAGE utilizes simple modification operations such as insertions, deletions, replacements, and swaps. However, what distinguishes STAGE lies in the selection of optimal words for each modification. This is achieved by leveraging a word-relation graph called the co-graph. The co-graph takes into account both word frequency and co-occurrence, providing valuable information for operand selection. To assess the performance of STAGE, we conduct evaluations using seven representative datasets and three different PLMs. Our results demonstrate the effectiveness of STAGE across diverse data domains, varying data sizes, and different PLMs. Also, STAGE demonstrates superior performance when compared to previous methods that use simple modification operations or large language models like GPT3. 논문 #2: “Code Defect Detection using Pre-trained Language Models with Encoder-Decoder via Line-Level Defect Localization”, LREC-COLING 2024 (인공지능학과 석사과정 안지민*, 2024년 소프트웨어학과 박사 졸업 최윤석*(공동 1저자*)) (논문 #2) “Code Defect Detection using Pre-trained Language Models with Encoder-Decoder via Line-Level Defect Localization” 논문에서는 코드에서의 결함 감지(Code Defect Detection) 작업을 효과적으로 수행하기 위해 코드의 라인 수준에서 결함을 식별하는 새로운 방법을 제안합니다. 라인 수준에서 결함을 식별하기 위해, 스페셜 토큰을 사용하여 코드를 라인으로 분리된 시퀀스로 변환합니다. 그런 다음, 사전학습모델(Pre-trained Models)의 인코더와 디코더가 정보를 다른 방식으로 처리하는 특성을 활용하여 라인 수준의 결함 지역화(defect localization)을 위해 인코더와 디코더를 모두 활용합니다. 코드 결함 검출 및 라인 수준의 결함 지역화를 통합하여 두 작업 간의 지식 공유(knowledge sharing)를 촉진하는 것이 제안 방법입니다. 실험 결과, 코드 결함 검출에 대한 네 가지 벤치마크 데이터 셋에서 성능을 크게 향상시키는 것을 확인해 제안방법이 효과적임을 보였습니다. [Abstract] Recently, code Pre-trained Language Models (PLMs) trained on large amounts of code and comment, have shown great success in code defect detection tasks. However, most PLMs simply treated the code as a single sequence and only used the encoder of PLMs to determine if there exist defects in the entire code. For a more analyzable and explainable approach, it is crucial to identify which lines contain defects. In this paper, we propose a novel method for code defect detection that integrates line-level defect localization into a unified training process. To identify code defects at the line-level, we convert the code into a sequence separated by lines using a special token. Then, to utilize the characteristic that both the encoder and decoder of PLMs process information differently, we leverage both the encoder and decoder for line-level defect localization. By learning code defect detection and line-level defect localization tasks in a unified manner, our proposed method promotes knowledge sharing between the two tasks. We demonstrate that our proposed method significantly improves performance on four benchmark datasets for code defect detection. Additionally, we show that our method can be easily integrated with ChatGPT.
-
- 작성일 2024-04-03
- 조회수 1683
-
- [동문] 최윤석 박사(지도교수 이지형), 한국외국어대학교 Language & AI융합학부 조교수 임용
- [동문] 최윤석 박사(지도교수 이지형), 한국외국어대학교 Language & AI융합학부 조교수 임용 소프트웨어학과 졸업생(2기) 최윤석 박사가 한국외국어대학교 AI융합대학 Language & AI융합학부 조교수로 2024년 3월부로 임용되었다. 최윤석 박사는 정보 및 지능 시스템 연구실(지도교수 이지형)에서 연구를 진행하며, 소프트웨어학과를 졸업하고, 대학원 소프트웨어플랫폼학과에 석박사통합과정으로 입학하여 2024년 2월 『Learning to Understand Code and Generate Text in Pre-trained Language Models』(지도교수 이지형)로 박사학위를 받았다. 최윤석 박사는 총 14개의 우수 국제 학회 발표 실적(BK/정보과학회 우수학회 12건)과 총 3편의 SCI(E) 논문을 게재하는 등 우수한 성과를 보였다. 최윤석 박사는 자동 코드 생성, 자동 코드 요약, 코드 질문 응답을 위해 대규모 언어 모델을 활용하는 연구에 관심을 가지며, 앞으로도 프로그래밍 교육을 위한 대규모 언어 모델에 대한 연구를 진행할 예정이다.
-
- 작성일 2024-03-18
- 조회수 1887
-
- [연구] [우홍욱 교수] CSI연구실, CVPR 2024 논문 게재 승인
- 우홍욱 교수 연구실 (CSI연구실), CVPR 2024 논문 게재 승인 CSI연구실 (지도교수: 우홍욱)의 논문이 인공지능 분야 우수학회인 CVPR 2024 (IEEE / CVF Computer Vision and Pattern Recognition Conference) 에 게재 승인(Accept) 되었습니다. 논문은 24년 6월 미국 시애틀에서 발표될 예정입니다. 논문 “Model Adaptation for Time Constrained Embodied Control” 은 소프트웨어학과 송재현 (석사과정), 유민종 (석박사통합과정) 연구원이 저자로 참여했습니다. 본 연구는 로봇이나 자율주행 차량과 같은 비전 기반 임바디드 (Embodied) 인공지능 에이전트를 위한 추론 지연 시간 제한에 유연한 대응이 가능한 딥러닝 모델 구조인 MoDeC (MoDel Adaptation for constrained embodied Control) 프레임워크를 제안합니다. MoDec을 통해, 학습 시 경험하지 못한 태스크의 즉시성에 따른 추론 지연 시간 제한 (Inference Latency constraint)과 모델이 설치된 제한된 리소스의 다비이스 환경에 맞추어, 임바디드 에이전트는 모델 추론에 관한 Few-Shot 최적 적응이 가능해집니다. 이를 위해, MoDeC은 다중 태스크 모듈 구조와 모듈 구조 상에서 추론 경로를 결정하는 동적 라우팅 네트워크, 그리고 디바이스 환경 최적화를 위한 디바이스 어댑터를 포함합니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 봇, 드론 자율주행 연구 등을 수행하고 있습니다. 이번 CVPR 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업의 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2024-03-07
- 조회수 2431