일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- MinHeap
- exists
- clustering
- opencv
- DP
- 자료구조
- 그래프 이론
- MySQL
- IN
- AlexNet
- machine learning
- 인공지능
- sklearn
- classification
- BFS
- dfs
- Reinforcement Learning
- 강화학습
- edge detection
- dynamic programming
- SIFT
- 백준
- 딥러닝
- canny edge detection
- Python
- 머신러닝
- Mask Processing
- image processing
- TD
- C++
- Today
- Total
JINWOOJUNG
딥러닝 논문 가이드 본문
본 포스팅은 위 블로그에서 정리된 최신 논문의 흐름을 바탕으로 논문을 분석한 것을 정리하는 포스팅입니다.
딥러닝을 공부하면서 논문을 읽기 시작했는데 방대한 양과 너무 빠른 변화에 따라가기 힘들어서 고민하던 중 위 블로그가 시기별, 주제별로 논문의 흐름을 잘 분석해 놔서 해당 흐름을 참조하여 논문을 읽어보고 정리하고자 한다.
카테고리는 아래와 같다.
[ Image Classification ]
Image Classification Task만 수행하는 모델부터 하나의 모델에서 Image Classification, Object Detection, Segmentation 등 다양한 Task를 모두 수행하는 Vision generalist 모델까지 모두를 포함한다.
[ Object Detection ]
2014년 발표된 R-CNN부터 2023년 발표된 YOLO v7까지 포함한다.
[ Image Segmentation ]
Semantic Segmentation, Instance Segmentation, Panoptic Segmentation 모두를 포함한다.
[ Image Generative Model ]
2014년 발표된 GAN을 시작으로 이미지 생성 모델이 시작되었다. 이후 Normalizaing Flow 방법들이 유행했고, 최근에는 Diffusion Model이 전성기를 맞이하고 있다.
[ Language Model ]
2013년 Word2Vec 논문부터 시작해, 2017년 Transformer이후 발표된 GPT 시리즈와 BERT 등은 엄밀히 말하면 Large Language Mode(LLM)으로 따로 분류하나 모두 포함한다.
[ Vision Language Model ]
최근 많이 성장하고 있는 분야로, Transformer 발표 이후 다양한 방법의 Cross Modal Attention이 연구되었고, 이 기법을 통해 Vision Embedding과 Language Embedding을 효과적으로 Fusion할 수 있는 방법이 많이 발표되었다.
[ ETC ]
위 7가지 카테고리 포함되지 않은 딥러닝 연구 분야에 대한 대표 논문에 대한 소개를 진행한다.
여덟가지 카테고리의 주요 논문을 시기별로 정리한 표이다.
형광색 표시가 된 논문은 해당 기법을 대표하거나 전체 흐름을 바꾼 논문으로 필수적으로 읽어야 하는 논문이다.
형광색 표시가 없는 논문은 해당 기법을 대표하는 논문이 발표된 후, 이를 더 응용하고 발전시킨 모델이다.
앞으로 위 순서를 따라 논문을 읽고 분석하여 정리할 계획이다.
'딥러닝 > 논문' 카테고리의 다른 글
[ Image Classification ] AlexNet / ImageNet Classification with Deep ConvolutionalNeural Networks (2) | 2023.12.18 |
---|