-
- [연구] 소프트웨어학과 이지형 교수, 대학ICT연구센터사업 선정
- 소프트웨어융합대학 이지형 교수, 대학ICT연구센터사업 선정 - 인공지능(AI) 분야에 이지형 교수 선정
-
- 작성일 2024-07-12
- 조회수 797
-
- [연구] [이지형 교수] 정보 및 시스템 연구실, ECCV 2024 논문 2편 게재 승인
- 정보 및 지능 시스템 연구실(지도교수:이지형)의 논문 2편이 컴퓨터 비전 및 인공지능 분야의 최우수 국제 학술대회인 European Conference on Computer Vision (ECCV) 2024에 게재 승인되었습니다. 논문 #1 : "ExMatch: Self-guided Exploitation for Semi-Supervised Learning with Scarce Labeled Samples" (전자전기컴퓨터공학과 박사 김누리, 인공지능학과 석박통합과정 이진섭) "ExMatch: Self-guided Exploitation for Semi-Supervised Learning with Scarce Labeled Samples " 논문에서는 레이블 데이터의 수가 매우 희소할 때 발생하는 준지도 학습(Semi-supervised Learning)의 성능 저하를 막기 위한 방법을 제안합니다. 준지도 학습은 소수의 레이블 데이터와 다수의 언레이블 데이터를 함께 사용하여 학습을 수행하는 방법입니다. 하지만 레이블 데이터가 희소해지면, 준지도 모델은 레이블 데이터로부터 얻을 수 있는 정보가 감소하기 때문에 언레이블 데이터를 잘못된 레이블로 활용할 가능성이 높아집니다. 이를 해결하기 위해 본 논문에서는 자기지도 모델을 사용하여 데이터의 분포 정보를 얻고, 이를 기반으로 신뢰할 수 있는 언레이블 데이터를 선별하여 추가적으로 학습하는 새로운 방법을 제안합니다. 제안 방법은 클래스별 레이블 데이터가 매우 희소한 상황에서 약 5%에서 21%의 높은 성능 향상을 보여줍니다. Abstract: Semi-supervised learning is a learning method that uses both labeled and unlabeled samples to improve the performance of the model while reducing labeling costs. When there were tens to hundreds of labeled samples, semi-supervised learning methods showed good performance, but most of them showed poor performance when only a small number of labeled samples were given. In this paper, we focus on challenging label-scarce environments, where there are only a few labeled samples per class. Our proposed model, ExMatch, is designed to obtain reliable information from unlabeled samples using self-supervised models and utilize it for semi-supervised learning. In the training process, ExMatch guides the model to maintain an appropriate distribution and resist learning from incorrect pseudo-labels based on the information from self-supervised models and its own model. ExMatch shows very stable training progress and the state-of-the-art performances on multiple benchmark datasets. In extremely label-scare situations, performances are improved by about 5% to 21% for CIFAR-10/100 and SVHN. ExMatch also demonstrates significant performance improvements in high-resolution and large-scale dataset such as STL-10, Tiny-ImageNet, and ImageNet. 논문 #2 : "IGNORE: Information Gap-based False Negative Rejection for Single Positive Multi-Label Learning" (인공지능학과 석사 송경렬, 전자전기컴퓨터공학과 박사 김누리, 인공지능학과 석박통합과정 이진섭) " IGNORE: Information Gap-based False Negative Rejection for Single Positive Multi-Label Learning " 논문에서는 이미지당 하나의 긍정 레이블만 주어진 환경에서의 다중 레이블 분류(Single Positive Multi-Label Learning, SPML)를 위한 학습 방법을 제안합니다. 대부분의 기존 방법들은 주석되지 않은 레이블 (unannotated label)을 부정 레이블 (negative label)로 가정하는데, 이 과정에서 일부 긍정 레이블을 부정 레이블로 잘못 간주합니다. 즉, 이러한 가정에서는 거짓 부정(False Negative) 레이블들이 발생하여 다중 레이블 분류 모델의 학습을 방해하고 모델 일반화 성능을 저하하는 문제가 있습니다. 이러한 거짓 부정 레이블들을 학습에서 제외시키기 위해, 본 논문에서는 로짓 (logit) 차이를 기반으로 한 거짓 부정 레이블 거부 방법을 제안합니다. 제안된 방법은 주어진 단일 긍정 라벨의 판별 영역을 제외한 모든 부분이 제거된 마스크 이미지를 생성합니다. 마스크 이미지에 객체 정보가 없을 때, 해당 객체에 대한 모델의 로짓이 낮다는 점을 이용하여, 마스크 이미지와 원본 이미지 사이에 모델의 로짓 차이가 큰 경우 거짓 부정 라벨로 식별합니다. 즉, 이미지 변형을 통해 이미지 수준에서의 정보 차이를 발생시키고, 이에 따른 모델 출력 차이를 거짓 부정 식별의 기준으로 삼습니다. 제안 방법은 Pascal VOC 2012, MS COCO, NUSWIDE, CUB과 같은 다양한 다중 레이블 데이터셋에서 우수한 성능을 달성하였습니다. Abstract: Single Positive Multi-Label Learning (SPML) is a learning environment for multi-label classification task, in which each image is assigned only one positive label while the other labels remain unannotated. Most approaches for SPML assume unannotated labels as negatives (“Assumed Negative", AN). However, with this assumption, some positive labels are inevitably regarded as negative (false negative), resulting in model performance degradation. Therefore, identifying false negatives is the most important with AN assumption. Previous approaches identified false negative labels using the model outputs of assumed negative labels. However, models were trained with noisy negative labels, their outputs were not reliable. Therefore, it is necessary to consider effectively utilizing the most reliable information in SPML for identifying false negative labels. In this paper, we propose an Information Gap-based false Negative lOss REjection (IGNORE) method for SPML. We generate the masked image that all parts are removed except for the discriminative area of the single positive label. It is reasonable that when there is no information of an object in the masked image, the model’s logit for that object is low. Based on this intuition, we identify the false negative labels if they have a significant model’s logit gap between the masked image and the original image. Also, by rejecting false negatives in the model training, we can prevent the model from being biased to false negative labels, and build more reliable models. We evaluate our method on four datasets: Pascal VOC 2012, MS COCO, NUSWIDE, and CUB. Compared to previous state-of-the-art methods in SPML, our method outperforms them on most of the datasets.
-
- 작성일 2024-07-09
- 조회수 1739
-
- [연구] [이호준 교수] 시스템보안연구실, ACM CCS 2024 학술대회 논문 게재 승인
- 시스템보안 연구실 (지도교수 이호준, https://sslab.skku.edu)의 임하정(박사과정), 김재윤(석박통합과정) 학생 참여 논문 "uMMU: Securing Data Confidentiality with Unobservable Memory Subsystem"이 논문이 보안분야 4대 학회 중 하나인 ACM CCS 2024에 게재 승인되어 10월에 발표될 예정입니다. 다음은 논문의 개요입니다: 현대 컴퓨팅 시스템의 메모리 계층 구조는 여러 종류의 보안 위협에 노출되어 있어 데이터 기밀성 보장이 계속해서 어려움을 겪고 있습니다. 공격자들은 다양한 강력한 공격 기법을 통해 중요 데이터를 직간접적으로 유출해왔으며, 새로운 공격들이 지속적으로 발견되고 있습니다. 안전하지 않은 언어로 작성된 프로그램에서의 메모리 안전 (Memory Safety)는 달성하기가 매우 어려워 공격으로 인한 비정상적인 메모리 접근이 직접적인 공격 경로로 사용되고 있습니다. HeartBleed와 같은 보안 사고가 이러한 공격의 대표적인 예시입니다. 최근에는 마이크로아키텍처 부채널 공격이 일반 프로그램뿐만 아니라 TEE(Trusted Execution Environment) 같은 기술로 보호된 프로그램의 데이터조차 유출 가능함을 증명하고 있습니다. 이 논문에서는 uMMU라는 새로운 프로세스 내 데이터 보호를 위한 메모리 서브시스템을 제시합니다. uMMU는 프로세서 레지스터를 관측할 수 없는 저장소로 사용하는 기법을 메모리 암호화 및 Oblivious RAM과 같은 데이터 기밀 보호 기술과 유기적으로 통합합니다. uMMU는 프로세서 아키텍처의 확장 레지스터(예: Intel x86의 AVX512)를 관측할 수 없고 주소 지정 가능한 물리 메모리로 추상화합니다. 가상 메모리 원칙을 완성하는 것은 암호화 또는 ORAM과 같은 메모리 기밀성 정책이 적용된 안전한 스왑 공간을 유지하는 메모리 관리입니다. uMMU는 민감한 데이터에 대한 데이터 기밀성 정책을 호스팅할 수 있는 범용적이고 강력한 데이터 보안 프레임워크입니다. 실험 결과에 따르면, uMMU는 민감한 데이터 보호를 위한 암호화 및 ORAM 스킴을 사용한 프로그램의 성능을 크게 향상시킵니다. MbedTLS의 민감 데이터 암호화 기반 보호에서 평균 69.93%의 성능 향상, 그리고 Memcached의 해시 테이블에서의 액세스 패턴을 숨기는 ORAM 기반 보호에서 497.84%의 성능 향상을 보였습니다. 영문 Abstract: Ensuring data confidentiality in a computing system's memory hierarchy proved to be a formidable challenge with the large attack surface. Diverse and powerful attacks threaten data confidentiality. Memory safety is notoriously hard to achieve with unsafe languages, thereby empowering adversaries with unauthorized memory accesses, as represented by the HeartBleed incident. More recently, microarchitectural side channel attacks reign as a prevalent threat against data confidentiality that affects program execution including the safeguarded ones inside TEEs. In this paper, we introduce an in-process memory subsystem called uMMU. uMMU coherently consolidates the notion of employing processor registers as unobservable storage with data confidentiality protection techniques such as memory encryption and Oblivious RAM. uMMU creates a new address space called uVirtual address space that is unobservable to adversaries. Under the abstraction created by uMMU, the processor's spacious extended registers, such as Intel x86's AVX512, are transformed into unobservable and addressable physical memory backing. Completing the principles of virtual memory abstraction is the memory management that maintains a secure swap space applied with memory confidentiality policies such as encryption or ORAM. uMMU is a versatile and powerful framework that can host data confidentiality policies on sensitive data. Our real-world evaluation indicates that uMMU significantly improves the performance of programs with encryption and ORAM schemes for sensitive data protection: an average of 69.93% improvement in encryption-based protection of sensitive data in MbedTLS, and 497.84% for ORAM-based elimination of access patterns on Memcached's hashtable.
-
- 작성일 2024-07-08
- 조회수 1437
-
- [연구] [김유성 교수] CSI 연구실, 임정기 석사과정 ECCV 2024 논문 게재 승인
- CSI 연구실의 (지도교수: 김유성) 논문이 컴퓨터 비전 및 인공지능 분야의 Top-tier 학술대회인 European Conference on Computer Vision (ECCV) 2024에 게재 승인되었습니다. 논문 "Cross-Domain Semantic Segmentation on Inconsistent Taxonomy using Vision Language Models" 은 석사과정 임정기군이 저자로 참여했습니다. 비지도 도메인 적응은 (Unsupervised Domain Adaptation, UDA) 정답 레이블과 함께 주어진 소스 도메인 (예: 가상 주행 데이터) 에서 학습 후 레이블이 없는 타겟 도메인으로 (예: 실제 주행 데이터) 적응할 수 있습니다. 특히 픽셀 단위 (예: semantic segmentation) 라벨링을 수작업으로 하는데는 비용이 큰 만큼 UDA 는 매우 중요합니다. 기존의 UDA 연구는 일관된 클래스 체계를 전제로 하였으나, 실제 상황에서는 소스와 타겟 도메인 간에 클래스 차이가 존재할 수 있습니다. 이 논문에서는 비전 언어 모델 (VLMs)을 활용하여 클래스 체계가 불일치하는 상황에서도 효과적으로 도메인 적응을 수행하는 방법을 소개합니다. 제안된 방법은 기존 UDA 방법의 세그먼트 추론과 VLMs의 풍부한 의미적 지식을 결합하여 타겟 도메인의 클래스에 맞게 재라벨링합니다. 이로 인해 소스 도메인에서 존재하지 않는 클래스를 포함한 타겟 도메인으로 비지도 적응이 가능해졌으며, 다양한 벤치마크에서 일관된 성능 향상을 보여줍니다. 김유성 | yskim525@skku.edu | CSI Lab. | https://csi-skku.github.io
-
- 작성일 2024-07-04
- 조회수 1425
-
- [연구] [이진규 교수] 실시간 컴퓨팅 연구실 RTCL@SKKU, ACM/IEEE DAC 2024, IEEE RTAS 2024 논문 발표
- 실시간 컴퓨팅 연구실(지도교수: 이진규)에서 작성한 논문이 ACM/IEEE DAC 2024 (the 61th Design Automation Conference)와 IEEE RTAS 2024 (30th IEEE Real-Time and Embedded Technology and Applications Symposium)에 발표되었습니다. ACM/DAC은 Design Automation 분야의 Top1 국제 학술대회(정보과학회 최우수 등급, BK21+ IF3)이고 올해는 미국 샌프란시스코에서 2024년 6월 23일~27일 개최되었며, IEEE RTAS는 실시간 시스템 분야의 Top2 국제 학술대회(정보과학회 최우수 등급, BK21+ IF2)이며 올해는 홍콩에서 2024년 5월 13일~16일 총 29편의 논문이 발표되었습니다. ACM/IEEE DAC 2024 논문은 MCU등 소형 IoT 기기에서 인공지능 응용 작업 실행에 대한 실시간성 보장을 다루고 있으며, 실시간 컴퓨팅 연구실 석사과정 강석민 학생(제1저자), 박사과정 이성태 학생(공동제1저자), 학부과정 구현우 학생이 이진규 교수의 지도하에 참여하였고, DGIST 좌훈승 교수와의 공동연구로 진행되었습니다. IEEE RTAS 2024 논문은 메모리 부족 환경에서의 인공지능 응용 작업의 실행에 대한 실시간성 보장을 다루고 있으며, DGIST 좌훈승 교수 연구팀 주도하에 이진규 교수가 참여하였습니다. ACM/IEEE DAC 2024 홈페이지 https://www.dac.com/ IEEE RTAS 2024 홈페이지 https://2024.rtas.org/ 실시간 컴퓨팅 연구실 홈페이지 https://rtclskku.github.io/website/ - 논문제목: RT-MDM: Real-Time Scheduling Framework for Multi-DNN on MCU Using External Memory - Abstract: As the application scope of DNNs executed on microcontroller units (MCUs) extends to time-critical systems, it becomes important to ensure timing guarantees for increasing demand of DNN inferences. To this end, this paper proposes RT-MDM, the first Real-Time scheduling framework for Multiple DNN tasks executed on an MCU using external memory. Identifying execution-order dependencies among segmented DNN models and memory requirements for parallel execution subject to the dependencies, we propose (i) a segment-group-based memory management policy that achieves isolated memory usage within a segment group and sharded memory usage across different segment groups, and (ii) an intra-task scheduler specialized for the proposed policy. Implementing RT-MDM on an actual system and optimizing its parameters for DNN segmentation and segment-group mapping, we demonstrate the effectiveness of RT-MDM in accommodating more DNN tasks while providing their timing guarantees. - 논문제목: RT-Swap: Addressing GPU Memory Bottlenecks for Real-Time Multi-DNN Inference - Abstract: The increasing complexity and memory demands of Deep Neural Networks (DNNs) for real-time systems pose new significant challenges, one of which is the GPU memory capacity bottleneck, where the limited physical memory inside GPUs impedes the deployment of sophisticated DNN models. This paper presents, to the best of our knowledge, the first study of addressing the GPU memory bottleneck issues, while simultaneously ensuring the timely inference of multiple DNN tasks. We propose RT-Swap, a real-time memory management framework, that enables transparent and efficient swap scheduling of memory objects, employing the relatively larger CPU memory to extend the available GPU memory capacity, without compromising timing guarantees. We have implemented RT-Swap on top of representative machine-learning frameworks, demonstrating its effectiveness in making significantly more DNN task sets schedulable at least 72% over existing approaches even when the task sets demand up to 96.2% more memory than the GPU’s physical capacity. 이진규 | jinkyu.lee@skku.edu | 실시간컴퓨팅 Lab. | https://rtclskku.github.io/website/
-
- 작성일 2024-06-28
- 조회수 1509
-
- [연구] [박진영 교수] HLI연구실, ICML 2024 Spotlight 논문 게재 승인
- HLI연구실 (지도교수: 박진영)의 박상준 학부연구생의 논문이 인공지능 학회 ICML 2024(The Forty-first International Conference on Machine Learning) 에 Spotlight(Acceptance rate 3.5%)로 게재 승인(Accept) 되었습니다. 해당 논문은 24년 7월 오스트리아 비엔나에서 발표될 예정입니다. 본 연구 "Memoria: Resolving Fateful Forgetting Problem through Human-Inspired Memory Architecture"는 인공지능 모델을 위한 기억 시스템을 제안합니다. 인공신경망이 장기기억을 갖도록 만드는 것은 오랜 문제이며 외부 기억을 활용하는 다양한 기법이 등장했지만, 대부분 최근 정보를 단기적으로 보존하는 것에 초점을 맞추었습니다. Memoria는 인간의 뛰어난 기억 시스템에서 영감을 받아 다양한 심리학과 신경과학적 이론을 바탕으로 설계되었습니다. 실험결과는 Memoria가 정렬, 언어 모델링 및 분류와 같은 다양한 작업에서 뛰어난 성능을 보임을 입증합니다. 또한 Memoria의 기억을 분석하여 Memoria에서 인간 기억의 특성인 초두효과(primacy effect), 최신효과(recency effect) 및 시간 연속성 효과(temporal contiguity effect)가 나타남을 보였습니다. 논문: https://arxiv.org/abs/2310.03052
-
- 작성일 2024-06-13
- 조회수 2012
-
- [연구] [우사이먼성일 교수] DASH 연구실, Won PAKDD 2024 Best Paper Running-Up Award (2nd Place)
- [우사이먼성일 교수] DASH 연구실, Won PAKDD 2024 Best Paper Running-Up Award (2nd Place) 대만 타이페이에서 5월 7일부터 10일까지 열린 PAKDD 2024 (BK CS IF=1)에서 DASH 연구실(지도교수: 우사이먼성일)의 Bin M. Le 박사과정학생과 우사이먼성일교수의 "SEE: Spherical Embedding Expansion for Improving Deep Metric Learning" 논문이 Best Paper Running-Up Award (2nd Place) 수상하였습니다. 이번 PAKDD 2024는 전 세계에서 submit된 720편의 우수한 논문들 중에서 엄격한 심사 과정을 거쳐, 최종적으로 단 4편의 논문이 Best Paper로 선정되었습니다. 논문링크: https://link.springer.com/chapter/10.1007/978-981-97-2253-2_11 https://pakdd2024.org/award24awardpakdd24/
-
- 작성일 2024-06-07
- 조회수 1607
-
- [연구] [구형준 교수] SecAI 연구실, IEEE S&P 2024, Distinguished Paper Award 수상
- [구형준 교수] SecAI 연구실, IEEE Symposium on Security and Privacy 2024 (S&P '24), Distinguished Paper Award 수상 SecAI 연구실 (지도교수 구형준, https://sslab.skku.edu)와 고려대학교 해킹대응기술 연구실 (지도교수 김휘강, https://ocslab.hksecurity.net/)이 공동연구한 "BENZENE: A Practical Root Cause Analysis System with an Under-Constrained State Mutation" 논문이 보안 분야 최고 컨퍼런스 중 하나인 IEEE Symposium on Security and Privacy 2024 (S&P '24) 학회에서 Distinguished Paper Award (학술 대회에서 발표된 논문 중 특히 뛰어난 성과를 인정받은 논문에게 수여되는 상)를 수상하였다. Distinguished Paper Award는 S&P '24에서 발표된 261편의 논문 중 9편 (~3%)에 수여되었다. 논문 요약: 퍼징은 랜덤으로 입력값을 생성해 소프트웨어가 의도하지 않은 행위를 하는지 확인해서 버그를 찾는 기술이다. 특히 보안 취약점을 찾는데 자주 활용되고 있는데, 마이크로소프트와 구글같은 회사에서도 퍼징을 활용해 자사의 제품을 테스트한다. 종종 보안 취약점을 통해 프로그램의 비정상적인 동작을 유발하는 입력값을 크래시(crash)라고 한다. 본 논문은 크래시가 주어졌을 경우 근본 원인을 분석 (root cause analysis)하기 위해 크래시 기반의 통계적 디버깅을 이용해 효율적으로 자동화하는 방식을 소개한다. 특히 이 논문에서는 완화된 조건 하에 상태변이 (under-constrained state mutation)라는 새로운 기법을 소개하고, 기존 접근방식에 비해 평균 30배 이상 더 적은 메모리로 평균 4배 이상 더 높은 성능을 낼 수 있는 Benzene이라는 시스템을 설계했다.
-
- 작성일 2024-05-29
- 조회수 1784
-
- [연구] [우홍욱 교수] CSI연구실, ACL 2024 논문 게재 승인
- [우홍욱 교수] CSI연구실, ACL 2024 논문 게재 승인 CSI연구실 (지도교수: 우홍욱)의 논문이 인공지능 분야 우수학회인 ACL 2024 (The 62nd Annual Meeting of the Association for Computational Linguistics) 에 Findings 게재 승인(Accept) 되었습니다. 논문은 24년 8월 태국 방콕에서 발표될 예정입니다. 논문 “Semantic Skill Grounding for Embodied Instruction-Following in Cross-Domain Environments” 은 소프트웨어학과 신상우 (석사과정), 김승현 (석사과정) 이 제1저자로 참여했으며, LG AI연구원 이문태 랩장, 장영수 연구원이 공저자로 참여했습니다. 본 연구는 로봇 에이전트와 사용자간 명령형 대화에 기반하여 지시된 태스크 (Embodied Instruction-Following, EIF)를 수행할 때, 초거대언어모델 (LLM)을 활용하여, 지시된 태스크 수행에 필요한 스킬의 실행 방법을 타켓 환경에 맞추어 최적 변환하는 SemGro (Semantic Skill Grounding) 기법을 제안합니다. SemGro는 특정 물리적 환경 특성에 최적화된 (Long-horizon rich-semantic) 스킬부터 환경에 관계 없이 실행할 수 있는 일반화된 (Short-horizon low-semantic) 스킬을 계층적으로 관리하는 스킬 데이터베이스를 사전에 구성하고, 이를 태스크 수행시 실시간 참조하여, 지시된 태스크에 필요하면서 타켓 환경에 맞추어 실행가능한 스킬 실행 계획을 찾아내고 최적화합니다. SemGro는 홈 로봇 에이전트 테스트 환경인 VirtualHome 벤치마크의 실험을 통해, 다양한 EIF 시나리오와 동적 환경 변화에 대해 SOTA 대비 강건한 성능을 낼 수 있음을 보여주었습니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 연구 등을 수행하고 있습니다. 이번 ACL 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2024-05-27
- 조회수 2792
-
- [일반] [SKKU People] 도전과 은혜의 흘려보내기 (소프트웨어학과 이지형 교수)
- 도전과 은혜의 흘려보내기 (소프트웨어학과 이지형 교수)
-
- 작성일 2024-05-21
- 조회수 309