🧠

Thinking about the complexity and scale of the problem further, a seemingly inescapable conclusion for me is that we may also need embodiment, and that the only way to build computers that can interpret scenes like we do is to allow them to get exposed to all the years of (structured, temporally coherent) experience we have, ability to interact with the world, and some magical active learning/inference architecture that I can barely even imagine when I think backwards about what it should be capable of. In any case, we are very, very far and this depresses me. What is the way forward?

출처

수집시간

2021/08/23 12:46

연결완료

1 more property

...(The state of Computer Vision and AI: we are really, really far away. 2010.10.22)

AI 빙하기로부터 막 깨어날 무렵인 2012년, 테슬라 Ai 디렉터 캐퍼시가 쓴 글"사람이 사진을 보고 0.5초도 안되는 순간 이미지 전체의 맥락과 모든 물체들을 다 맞추고 뭐가 거울에 비친 모습이고 뭐가 뭔지 다 맞추지만

바보같은 컴퓨터는 이제서야 개인지 고양인지 이미지 분류 하고, 겨우 사람의 머리, 손, 발의 모양을 알아맞추고, 그마저도 잘하지도 못하고 무척이나 느린데

사진 전체에 대해서, 실제 상황에서 맥락을 이해하고 상황을 이해하고 물체 간 관계를 건져내고 - 현실에서 이 기술이 힘을 쓸 수 있으려면 도대체 컴퓨터비전 기술이 얼마나 더 발전해야 하는가?"

대충 글 전체를 읽어보면 너무 슬프다고 한탄하는 내용이야.그랬던 캐퍼시는 딱 9년만에, 딱 사진기와 컴퓨터만으로, 완전자율주행에 가장 가까운 소프트웨어를 만들어냈고 그걸 당당하게 공개했어.

이미 저때부터 "어떤 문제를 풀어야 하는가?" 를 완벽하게 알고 있었던 사람이었던 것 같아.

4년 전에 테슬라에 들어갔으니까, 딱 5년간 공부해서 4년간 제품을 만들어버렸어. 정말 저 사람의 길이 멋지고, 저 시간 안에 저걸 해냈다는게 존경스럽다. 자기가 과거에 슬퍼했던 이유를 돌아보면, 그 문제를 세상에서 가장 먼저 해결해 버린 지금 얼마나 뿌듯할까 부럽기도 하고