ICCV 2019 Review [1] 참석 후기 및 프로그램 소개

November 03, 2019 | 7 Minute Read

안녕하세요, 이번 포스팅에서는 이전에 작성했던 학회 참석 후기들처럼 ICCV 2019 학회에 다녀온 뒤 느낀 점들과 학회에 대한 소개, 주요 프로그램들을 요약하여 글로 작성할 예정입니다. 본 포스팅은 2편으로 구성이 되며 2편에서는 ICCV 2019의 Best Paper로 선정된 논문을 리뷰할 예정입니다.

제가 작성했던 주요 학회 참석 후기 글들은 다음과 같습니다.

또한 ICCV 2019가 시작하기에 앞서 학회에 제출된 논문들을 분석하여 시각화하고, 주요 논문들을 간단하게 리뷰한 글은 다음과 같습니다.

ICCV 2019 paper preview

이번 ICCV 2019는 서울 코엑스에서 개최가 되어서 무엇보다 익숙한 장소에서 진행이 되어서 친숙한 느낌을 받을 수 있었고, 집과 회사가 가까워서 이동이 용이해서 좋았습니다! 물론 학회의 내용도 정말 재미있고 좋았었는데 이러한 내용들에 대해 간단히 소개를 드리도록 하겠습니다.

본격적인 내용에 들어가기에 앞서, 이전 학회들과 마찬가지로, 좋은 학회에 참석할 수 있는 기회를 주신 저희 회사에 감사에 말씀을 드립니다!

ICCV 2019 Simple Overview

10월 27일(일) ~ 11월 2일(토) 까지 7일간 학회가 진행이 되었으며 첫 이틀과 마지막 하루에는 Workshop과 Tutorial이 진행이 되고, 학회의 중간 기간에는 Main Conference의 구두, 포스터 발표와 기업 부스의 Expo 등이 진행이 되었습니다. 일정을 보시면 아시겠지만 황금 같은 주말 아침에.. (무려 8시!) 시작을 해서 황금 같은 토요일에 학회가 끝나는 험난한 일정으로 구성이 되어있습니다. 하하하… 각 프로그램들 마다 유익한 정보들, 느낀 점 등을 간단하게 요약을 해보았습니다.

참석자, 논문 저자 통계

학회의 Main Conference의 첫 시작하는 자리에서 참가자들의 국적과, ICCV 2019에 accept된 저자들의 국적을 통계 낸 자료를 보여주었습니다.

한국에서 열린 학회다 보니 한국 사람이 약 40% 가 될 정도로 많은 비율을 차지하였고, 한국 근처의 나라인 중국, 일본, 러시아 등에서도 많이 참가를 하였습니다. 유럽보다는 미국에서 많은 참여를 한 점도 인상깊었습니다.

저자들의 국적 통계는 더욱 인상깊었는데요, 중국이 무려 350여편을 발표하면서 거의 30% 이상의 비율을 차지하였고 2위로는 미국이 근소한 차이로 뒤따르고 있었습니다. 한국은 4위에 위치하고 있습니다. 실제로 학회장에서도 포스터를 보면 대부분 중국인 저자의 포스터가 많이 보였습니다. Computer Vision 쪽에서는 중국이 강세를 보이는 추세를 잘 보여주고 있는 것 같았습니다.

Best Paper Award

위의 통계 자료를 보여준 뒤, 이어서 Best Paper Award를 받은 논문들이 발표가 되었습니다. 총 4편의 논문이 발표가 되었으며, 해당 논문들은 다음과 같습니다.

Best Paper Honorable Mentions
- “Asynchronous Single-Photon 3D Imaging” by Anant Gupta, Atul Ingle, Mohit Gupta
- “Specifying Object Attributes and Relations in Interactive Scene Generation” by Oron Ashual, Lior Wolf
Best Student Paper
- “PLMP - Point-Line Minimal Problems in Complete Multi-View Visibility” by Timothy Duff, Kathlén Kohn, Anton Leykin, Tomas Pajdla
Best Paper
- “SinGAN: Learning a Generative Model from a Single Natural Image” by Tamar Rott Shaham, Tali Dekel, Tomer Michaeli

저는 이 논문들 중 Best Paper인 “SinGAN: Learning a Generative Model from a Single Natural Image” 논문이 되게 인상깊어서 이 논문을 다음 포스팅에 리뷰할 예정입니다.

[10/27(일), 10/28(월), 11/2(토) Workshop]

처음에 Workshop 프로그램 스케쥴을 봤을 때 당황을 했었습니다. 굉장히 많은 주제의 프로그램이 동시에 진행이 되다보니 어떤 곳에 가야할지 정하는 것도 막막하였습니다. 심지어 같은 시간에 Tutorial도 진행이 되어서 선택과 집중을 해야했고, 저는 친숙하지 않은 Computer Vision 주제들은 과감하게 스킵을 하였습니다. 저는 일부는 참석하였고 일부는 참석하지 못했지만 아래의 워크숍들이 흥미로워 보였습니다.

이미지 인식 관련 데이터셋에 대해 챌린지를 진행했던 프로그램: Open Images Challenge , Vision Meets Drones 2019: A Challenge
Self-Supervised Learning 관련 프로그램: Extreme Vision Modeling
CNN Architecture에 대한 프로그램: Neural Architects
저전력 Computer Vision Deep Learning 모델에 대한 프로그램: Low Power Computer Vision

진행되었던 Workshop 프로그램 목록 및 내용들은 ICCV 2019 Workshop Program List 에서 확인하실 수 있습니다. 각 프로그램마다 어떠한 연사들이 어떠한 주제로 발표를 했는지 잘 나와있어서, 관심있으신 주제에 대해 살펴보시는 것을 추천드립니다!

[10/27(일), 10/28(월), 11/2(토) Tutorial]

Tutorial 세션도 Workshop과 같은 날 동시에 진행이 되었습니다. Workshop에 비해 Tutorial은 그나마 하루에 진행되는 프로그램의 개수가 적어서 선택의 폭이 많지 않아서 좋았습니다. 총 12개의 프로그램이 진행이 되었고 다양한 분야의 내용을 그 분야의 대가에게 설명을 들을 수 있어서 그 점이 좋았습니다. 저는 Tutorial 중 제 블로그에서 많이 다뤘던 분야인 Object Detection을 다룬 Visual Recognition for Images, Video, and 3D Tutorial이 가장 기억에 남았습니다.

Object Detection의 초기 모델인 R-CNN부터 Instance Segmentation 모델까지 어떻게 성장 해왔는지를 R-CNN의 저자 Ross Girshick 님이 잘 설명을 해주셨고, Detection, Instance Segmentation 연구가 나아가야할 방향을 제시하였습니다.

현재 논문 들에서 다루고 있는 데이터셋은 20개(VOC) 혹은 80개(COCO) 정도의 class만 분류를 하고 있는데 실용적으로 사용이 되려면 수천개의 class를 다룰 수 있어야 함을 강조하였고 이를 위한 데이터셋인
LVIS(Large Vocabulary Instance Segmentation) Dataset 을 소개하였습니다. 약 16만장의 이미지와 약 1200개의 class, 2백만개의 instance segmentation object로 구성이 되어있으며 class 불균형이 심한 long-tailed frequency distribution을 가지고 있습니다.

[LVIS Dataset: Long-tailed frequency distribution]

이 외에도 좋은 논문을 쓰기 위한 여러가지 조언도 남겼습니다. 주요 코멘트를 정리하면 다음과 같습니다.

논문은 하나의 집중된 아이디어나 문제에 대해 다뤄야 한다.
아이디어를 간단한 버전으로 보여라.
- Solid baseline으로부터 시작해라.
- 거기에 본인의 아이디어를 적용해라.
- Ablation(단계적 검증) 을 통해 아이디어의 가치를 증명해라.
Speed/Accuracy 비교는 공정하게 이뤄져야 한다.
- 논문에서 Speed와 Accuracy의 Trade-off를 분석하려면 통제된 환경(같은 하드웨어, 프레임워크로 인한 속도 차이가 있을 수 있는 점을 고려 등)을 구성해야한다.

이 세션 이후 바로 진행된 세션은 이번에 공개된 Detectron2 에 대해 소개를 하는 내용이었습니다.

기존의 Detectron은 Caffe2 기반이라 사용하기 번거로운 점이 있었는데 이번에 PyTorch 기반의 Detectron2 가 공개가 되었습니다!!

일단 PyTorch를 사용하기 때문에 훨씬 친숙한 코드를 이용할 수 있고, 무엇보다 여러 pretrained model을 제공하고있고 custom dataset으로 학습을 시키는 과정도 비교적 간단하게 할 수 있음을 보여주었습니다. 이 외에도 Advanced 유저를 위해 새로운 model을 만들거나 존재하는 model을 개선하거나, 새로운 data processing을 구현하거나 새로운 task, metric 등을 정의하는 등 유저가 원하는 기능을 추가하기 편하게 구현이 되어있어서 연구용으로도 사용하기 좋음을 보였습니다. 실제로 DensePose 나 TridentNet 연구를 Detectron2 를 customizing하여 사용하였고, 이에 대한 코드는 해당 링크 에서 확인하실 수 있습니다.

위의 Ross Girshick 님께서 말씀하셨던 Solid baseline을 위해 Detectron2를 사용하는 것이 좋은 선택지가 될 수 있을 것 같습니다.

이 외에도 진행되었던 Tutorial 프로그램 목록 및 내용들은 ICCV 2019 Tutorial Program List 에서 확인하실 수 있습니다

[10/29(화) ~ 11/1(금) Main Conference]

마지막으로 다룰 Main Conference는 4일간 진행이 되었으며 오전 타임과 오후 타임으로 나눠서 진행이 되었습니다.

구두 발표는 전체 논문 편수가 많다 보니 한 타임에 주제에 따라 2군데로 나뉘어져서 구두 발표가 진행이 되었고, 구두 발표는 한 타임에 15~20편의 논문이 각각 5분씩 발표를 하는 방식으로 진행이 되었습니다. 오전 타임은 9시 ~ 10시30분까지 발표가 진행되었고, 오후 타임은 1시 30분 ~ 3시30분 까지 발표가 진행이 되었습니다.

구두 발표가 끝나면 큰 홀에서 포스터 발표가 진행이 되었으며 포스터 발표는 오전은 10시 30분 ~ 1시, 오후는 3시30분 ~ 6시까지 각 타임당 2시간 30분씩 진행이 되었습니다. 한 타임당 약 150편 내외의 포스터 발표가 진행이 되어서 모든 논문을 둘러보기엔 시간과 체력에 제약이 있어서 선택과 집중이 중요하였습니다.

또한 제가 얼마전 리뷰했던 논문인 “Gaussian YOLOv3. An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomous Driving” 은 굉장히 많은 인기를 끌었습니다. ㅎㅎ

이 논문 외에도 여러 논문들의 포스터 앞에서 다양한 discussion이 진행이 되었고 저도 논문에서 제안한 방법들 중 이해가 잘 되지 않는 점이나 참신한 부분은 어떻게 떠올리게 되었는지 등을 질문을 하며 포스터를 감상하였습니다.

마치며..

이번 포스팅에서는 ICCV 2019에 다녀온 뒤 느낀 소감을 정리해보았고, 학회의 주요 프로그램 등을 소개 드리는 글을 작성하였습니다. 또한 인상깊게 들었던 Tutorial의 일부 내용을 공유 드렸습니다. 학회가 진행되는 동안 여러 기업 부스도 돌아다녔는데 친절하게 설명해주신 여러 기업 부스 분들께도 감사의 말씀 드리고 싶습니다!! 특히 저를 먼저 알아봐주시고 블로그도 언급해주신 마키나락스 선생님들, 제품을 친절하게 설명해주신 Lunit 분들, Superb AI 분들께도 감사의 말씀 드립니다!! 다음 포스팅에서는 ICCV 2019의 Best Paper에 대해 자세하게 리뷰를 수행할 예정입니다. 다음 포스팅도 많은 관심 부탁드립니다! 감사합니다!

« Tutorials of Object Detection using Deep Learning [9] Gaussian YOLOv3. An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomous Driving Review ICCV 2019 Review [2] Best Paper SinGAN： Learning a Generative Model from a Single Natural Image 리뷰 »

Hoya012's Research Blog