이 영역을 누르면 첫 페이지로 이동

Yphy 블로그의 첫 페이지로 이동

Yphy

페이지 맨 위로 올라가기

Yphy

머신러닝 개발 블로그

Vision Transformer

Yphy

Hybrid- Swin-Transformers 리뷰

Hybrid- Swin-Transformers 리뷰

2021.12.24

Efficient large-scale image retrieval with deep feature orthogonality and Hybrid- Swin-Transformers 안녕하세요 이번 논문은 Nvidia 의 Christof Henkel가 2021 Google Landmark recognition과 retrieval challenge 에서 우승하고 해당 대회에서 사용한 모델에 대해 쓴 논문입니다. 사실 코드가 아직 공개되지 않아서 방법론을 정확히 이해하진 못했으나 논문이 짧고 저자가 Kaggle 랭킹 1위이신 분이기도 해서 리뷰해봤습니다. 1. Introduction [Abstract] A model with deep orthogonal fusion of local and global featu..

Intriguing properties of vision transformer 리뷰

Intriguing properties of vision transformer 리뷰

2021.12.24

Intriguing properties of vit 개인적으로 Vision Transformer(VIT) 모델에 대해 관심이 많았고, intriguing~ 논문은 항상 흥미롭기 때문에 참을 수 없습니다. 논문의 abstract에 따르면 vision transformer가 occlusion, spatial permutation, domain shifts 같은 원본이미지에 대한 nuisances에 강건하다는 특징을 밝혀냈다고 합니다. Local texture에 biased한 CNN과는 달리 VIT는 shape biased representation을 한다는게 핵심인 것 같습니다. 1. Introduction CNN이 인풋 이미지의 엣지나, 윤곽선 정보를 통한 local interaction을 학습하는 반면에..

최신
- 1
다음

정보

Yphy 블로그의 첫 페이지로 이동

Yphy

Yphy의 첫 페이지로 이동

검색

메뉴

홈
태그
방명록

카테고리

분류 전체보기 (25)

최근 글

인기 글

댓글

공지사항

공지 - 소개

아카이브

태그

Object Detection
multi label classification
faster rcnn
Petfinder
Vision Transformer
Causal Inference
hybrid transformer
node embedding

나의 외부 링크

정보

Yphy

yphy

블로그 구독하기

구독하기
RSS 피드

방문자

전체 방문자
오늘
어제

티스토리

티스토리 홈
이 블로그 관리하기
글쓰기

Powered by Tistory / AXZ. © yphy. Designed by Fraccino.

티스토리툴바