알기쉬운 인공지능 튜토리얼

8월 12일 (화)
09:00 - 10:30
  • 문경식 교수 (고려대)
  • Personalized Expressive 3D Digital Humans from a Single Image (90분)
10:30 - 12:00
  • 이종욱 교수 (성균관대)
  • 생성형 검색 및 추천 모델의 최근 연구 동향 (90분)
16:30 - 18:00
  • 조준수 교수 (부산대)
  • TBD (90분)
8월 13일 (수)
09:00 - 10:30
  • 장부루 교수 (고려대)
  • Multimodal Large Language Models: 시각을 갖춘 LLM (90분)
10:30 - 12:00
  • 전해곤 교수 (GIST)
  • 3D Depth Perception (90분)
16:30 - 18:00
  • 최승진 소장 (Intellicode)
  • Robust Bayesian Optimization (90분)

문경식 교수
(고려대)

Biography
2025-현재 고려대학교 컴퓨터학과 조교수
2024-2024 대구경북과학기술원 전기전자컴퓨터공학과 조교수
2022-2024 Postdoctoral Research Scientist, Reality Labs Research at Meta
2021-2022 서울대학교 자동화시스템공동연구소 선임연구원
2015-2021 서울대학교 전기정보공학부 공학박사

Personalized Expressive 3D Digital Humans from a Single Image (90분)

Generating personalized and expressive 3D digital humans from a single image is a key challenge for virtual humans and embodied AI. In this talk, I will present two recent approaches—ExAvatar and PERSONA—that reconstruct animatable 3D avatars with realistic appearance, facial expressions, and hand gestures from minimal input. ExAvatar builds avatars from short videos using a hybrid 3D mesh and Gaussian representation, while PERSONA enables single-image avatar creation by leveraging diffusion-based video generation to model pose-driven deformations. These works show how combining geometric structure with generative models leads to scalable, high-fidelity avatar creation. I wil l also discuss future directions toward tighter integration with video generation models, opening the door to controllable, identity-preserving avatar animation directly from text or motion cues.


이종욱 교수
(성균관대)

Biography

생성형 검색 및 추천 모델의 최근 연구 동향 (90분)


조준수 교수
(부산대)

Biography

(90분)


장부루 교수
(고려대)

Biography
2025-현재 고려대학교 컴퓨터학과 조교수
2023-2025 서강대학교 인공지능학과/컴퓨터공학과 조교수
2020-2023 Hyperconnect Research Unit Lead
2016-2020 고려대학교 정보대학 컴퓨터공학 공학박사

Multimodal Large Language Models: 시각을 갖춘 LLM (90분)

Multimodal Large Language Models (MLLMs), which jointly understand visual information and text, are capable of performing a wide range of multimodal tasks beyond text alone. This talk will explain the fundamental architecture of MLLMs, introduce various tasks that can be tackled using MLLMs, and present recent advances in the field. Through this, we aim to provide a clear understanding of how MLLMs work and explore their potential for practical applications.


전해곤 교수
(GIST)

Biography
2022-현재 GIST AI융합학과 및 전기전자컴퓨터공학부 부교수
2024-현재 CVPR / ICCV Area Chair
2023-현재 (사) 한국컴퓨터비전학회 이사
2024-2024 Carnegie Mellon University 방문연구원
2019-2022 GIST AI대학원 및 전기전자컴퓨터공학부 조교수
2018-2019 Carnegie Mellon University 박사후 연구원
2018-2018 KAIST 박사후 연구원
2015-2018 KAIST 전기및전자공학과 박사

3D Depth Perception (90분)

깊이 정보는 카메라와 물체 간의 거리를 나타내는 영상신호이다. 컴퓨터비전 분야에서는 3차원 복원/인지/탐지/영상 개선 등에 필수적인 정확한 깊이 정보를 빠른 시간내에 추론하기 위한 노력을 40년 가까이 이어오고 있다. 이 기간동안 깊이 정보를 추론하기 위해 사용되는 센서의 종류와 기능적인 면에서 많은 변화가 있었고, 방법론 역시 전통적인 최적화에서 학습기반의 방법론까지 큰 발전이 있었다. 본 강연에서는 전통적인 스테레오 매칭부터 파운데이션 모델까지 센서와 방법론에 따른 깊이 정보 추론 연구의 변화와 발전을 살펴본다. 여기에 더해, 전통적인 방법론들이 현재 파운데이션 모델 기반의 깊이 정보 추론에 어떠한 영감을 주고 있는지도 소개한다.


최승진 소장
(Intellicode)

Biography
2022-현재 연구소장, Intellicode
2019-2021 CTO, BARO AI & 상임고문, BARO AI Academy
2001-2019 POSTECH 컴퓨터공학과 교수
2019-2021 정보과학회 인공지능소사이어티 회장
2018 삼성전자 종합기술원 자문교수
2017-2018 삼성리서치 AI센터 자문교수
2016-2017 신한카드 빅데이터센터 자문교수
2014-2016 정보과학회 머신러닝연구회 초대위원장

Robust Bayesian Optimization (90분)

Bayesian optimization (BO) has emerged as a powerful framework for efficiently optimizing expensive-to-evaluate, black-box functions across science and engineering. However, solutions found by standard BO can be deceptively fragile, often failing when deployed in the real world where environmental conditions fluctuate, hardware degrades, or adversaries intervene. To address this critical gap, this tutorial introduces Robust Bayesian Optimization, a class of methods designed to find solutions that are not only optimal but also remain effective and reliable in the face of real-world uncertainty. The need for such methods is more urgent than ever, as we deploy complex AI systems in high-stakes applications like autonomous driving and medical technology, where guaranteeing safe and consistent performance under unpredictable conditions is non-negotiable. After a quick overview of standard BO, we will explore three distinct and powerful paradigms for achieving robustness. We first delve into adversarially robust BO which finds solutions that can withstand worst-case or adversarial perturbations. Then we introduce distributionally robust BO, which are techniques that hedge against distributional shifts, seeking solutions that perform well across an entire family of plausible probability distributions for the uncertain parameters. Finally we explore robust Bayesian satisficing, which is a practical and decision-theoretic approach that shifts the focus from pure optimization to robust reliability. This framework aims to find solutions that satisfy predefined performance criteria with high confidence, which is often more valuable than finding a fragile optimum.