Search

3__1.2_2.1_3. [entry] title: DL 리서치를 효율적이게 하기 위한 워크플로

생성
🚀 prev note
🚀 next note
♻️ next note
14 more properties
이 글은 워크플로들 중 하나다.
아래 글은 리서치보다 보다 넓은 ‘문제해결’이라는 범주를 다루는 체크리스트다.
그래서 위 체크리스트와 아래 글의 내용을 결합하여 리서치에 활용할 수 있는 데일리 워크플로를 만든다. 이 엔트리포인트는 아래 엔트리포인트에 나열된 내용들과 리서치를 위해 활용할 수 있는 글들을 골라 리서치 워크플로를 위해 재조립하는 것을 목표로 한다.
리서치에 있어 이런 고민을 시작한 이유
1.
당장 딥러닝 관련 리서치를 해야 하는 상황들이 있었는데 지나치게 막막했다.
2.
때마침 ‘당장 무엇을 해야 하는가’ 에 답할 수 없다는 것이 리소스를 잡아먹는다는 생각을 했다.
3.
앞으로도 리서치를 할 수 있는 기회들이 있다고 판단했기 때문이다.
워크플로
1.
키워드를 얻는다.
입력
흥미로운 오픈소스, 오픈소스가 주력으로 사용하는 방법론, 논문의 제목, 키워드
가이더가 있는 경우, 특정 태스크를 수행하기 위해 풀어야 하는 질문
충분히 이터레이션을 돌았을 때, 확인해 보아야 하는 소스코드
반복
관심사가 일치하는 사람들의 커뮤니티를 찾아 들어간다. 끊임없이 키워드를 공급받을 수 있다. 트위터(형기님의 추천), 오픈카카오톡방 등을 사용할 수 있다.
얻은 작은 단서들을 바탕으로 단순히 구글 검색한다. 유튜브, 튜토리얼, 뉴스레터 등.
이 과정에서 영어를 읽다가 일부 단어가 대해 학술 용어인지, 그냥 함축적 표현인지 이해가 가지 않을 때 가차없이 LLM 을 활용한다. (SOTA: GPT4)
'unified framework for 3D content creation from text prompts, single images, and few-shot images, by lifting 2D text-to-image generation models.' 이 문장에서 lifting 이 의미하는 것이 뭐야?
Plain Text
복사
프롬프트 예시
문제에 대한 키워드를 얻고자 한다면 LLM 을 활용한다. (SOTA: Scispace)
딥페이크 태스크에서 얼굴A 를 얼굴 x에 입혀서 만들어진 이미지가 x_a이고 얼굴 A를 얼굴 y에 입혀서 만들어진 이미지가 y_a일 때, 이때 x_a와 y_a를 비슷하게 만들기 위한 연구들에 대한 키워드
Plain Text
복사
프롬프트 예시
논문에서 키워드를 빠르게 추출하고자 한다면, 특정 내용이 존재하는지 확인하기 위해 LLM 을 활용한다. (SOTA: Scispace). Scispace 의 RAG을 이용해 질문을 입력해 보는 것이 큰 도움이 된다.
예시
결과물
키워드 5개 - 키워드(논문 제목이 아님)가 의미하는 것, 풀고자 하는 문제 테이블
관련도가 높은 것으로 꼽았기 때문에, 문제와 직접적으로 관련이 있는 것들 위주로 도마 위에 올라갈 것임. 이것은 초기 학습 시 매우 유용함.
반복하면 반복할수록 근처의 키워드로 검색 범위가 커져 나갈텐데, 이때 제텔카스텐의 위력이 잘 드러날 수 있음. 시드가 충분히 쌓일 때까지 너무 욕심부리지 말자.
내가 하고자 하는 일과 비슷한 것들 순서로 정렬
조금 오개념이 있어도 괜찮음
제텔카스텐 - permanent 노트를 작성할 필요 없음
나중에 반드시 여기에 돌아올 것임. 그때 작성하면 됨.
제텔카스텐 - 궁금한 것들이 담겨 있는 fleeting 노트들
모듈별 소스코드
2.
역사를 중심으로 커다란 개념을 의미적으로 알아본다.
반복
각 키워드들을 바탕으로 역사를 구글 검색한다.
제텔카스텐 방식으로 글을 쓴다.
수식을 마주칠수도 있고, 의미들을 마주칠수도 있다. 여기서 중요한 것은 단순히 수식을 너머 의미를 파악하려고 노력하는 것이다. 단순히 구글 검색을 했을 때 나오는 것들을 적어 대지는 마라.
어디까지 다이브를 해볼 것인가의 기준은 플리팅노트/질문의 갯수가 되면 좋을 것 같고, 어느 깊이까지 공부를 할 것인가의 기준도 제텔카스텐 영구노트/프로젝트노트의 갯수가 되어도 좋다. 마일스톤은 키워드의 SOTA 논문의 소스코드를 따라갈 수 있는 것이다.
잘 정리되어 있는 하나의 글을 정독하는 것은 좋은 방법이다. 해당 아티클이 레퍼런스로 언급한 논문들은 문서 폴더와 라이브러리에 넣는다. (SOTA: Scispace)
피드백을 위해 LLM 을 활용한다. (SOTA: GPT-4)
<글> - 이런 짧은 글을 작성해 봤는데 잘못된 개념이나 문제를 지적해 줘. - 글을 개선해 줘.
Plain Text
복사
프롬프트
오개념을 고친다.
 위까지를 몇 번 이상 반복한 뒤, 사람에게 피드백을 받는다.
오개념을 고친다.
결과물
제텔카스텐 - permanent 노트
제텔카스텐 - 아이디어들이 담겨 있는 fleeting 노트들
꼭 필요한 경우가 아니라면, 프로그래밍을 하지 않는다.
3.
제안된 방법론들을 이해하고 한계(limitation)를 찾아낸다.
입력
제텔카스텐 - permanent 노트들
제텔카스텐 - fleeting 노트들
반복
논문 읽기
일반적으로 논문을 읽는 방법이라고 여겨지는 것들을 쭉 따라가되, 가장 마지막 단계까지는 가지 않는다. 이 과정에서 모든 기술을 의미론적으로 파악해야 한다. 의미론적이라고 파악한다는 것은 모델이나 방법론이 데이터를 처리하는 커다란 의미를 파악하는 것이다.
피드백을 위해 LLM 을 활용한다. (SOTA: GPT-4)
<글> - 이런 짧은 글을 작성해 봤는데 잘못된 개념이나 문제를 지적해 줘. - 글을 개선해 줘.
Plain Text
복사
프롬프트
 위까지를 몇 번 이상 반복한 뒤, 사람에게 피드백을 받는다.
결과물
꼭 필요한 경우가 아니라면, 프로그래밍을 하지 않는다. (초기 n번의 반복 시에는 특히)
제텔카스텐 - permanent 노트들
제텔카스텐 - fleeting 노트들