Search

13:00, NLP 에서 기원한 Transformer 의 Q,K,V 가 이미지에서 어떤 의미를 가질지 고민을 해 보았다. 굳이 표현을 하자면, Q 는 이미지 패치의 픽셀의 고정된 표현, K 는 패치의 픽셀들과 다른 픽셀들 사이의 관계를 정의, V 는 원래 가지고 있던 이미지의 특징에 대한 표현이라고 생각을 한다.

출처
수집시간
2021/11/06 08:42
연결완료
1 more property