문제 | 프로젝트를 수행할 수 있을지 없을지 감이 잘 안 잡힌다. 논문을 구현하는 일 자체도 꽤 많은 시간을 차지하지만, 구현 이외의 다른 기술적인 작업에 얼마나 많은 시간이 필요할지 전혀 모른다는 것이 프로젝트 진행 여부 판단을 가로막는다. |
해결 | 전체 사이클을 최대한 쉽고 크게 한 번 돌아보면서, 어떤 부분에서 시간이 오래 걸리게 될지를 파악해볼 필요가 있다. |
목적 | 과제를 수행할 수 있는지 우리의 능력을 파악하기 위함이다. (마일스톤1을 실패할 경우 프로젝트 성공확률이 0% - ) |
마일스톤 목표 | 작은 규모의 COCO 포맷 데이터셋을 이용해서 베이스라인 모델의 결과를 만드는 파이프라인을 도커로 패키징한다. |
순서대로 가기는 어렵다. 왜냐하면, 원시 데이터와 관련된 검증은 우리의 의지와 상관없이 들어올 때마다 작업을 해 주어야 한다. 데이터 로더나 coco 변환기는 경태파트장님이 가지고 있어서 우리가 핸들링 불가능하기 때문이다.
•
업무 분할
◦
@Beeline
▪
오픈소스, 완전 간단한 모델 (되도록이면 논문의 baseline 이면 좋을 것 같음)
•
모델선정
▪
그 오픈소스가 사용하는 데이터 포맷
•
coco data format
▪
데이터 100장 (coco-small 이면 좋을 것 같음)
•
데이터수집
▪
학습 가능한 상태
•
선정한 모델 구현
•
training, validation 코드 작성
▪
스코어 추출 가능한 상태
•
커맨드 >> result.txt
▪
도커 패킹
◦
@이장후
▪
아래 구성 요소들을 도커로 패킹하여 컨테이너로 만들고, 커맨드 하나만으로 도커 컨테이너를 켜고 학습이 시작되도록 만든다.
•
pytorch classification tutorial - model
•
pytorch classification tutorial - dataset
▪
하는 이유
•
머신러닝 프레임워크나 모델의 복잡성을 잠깐 묻어 두고, docker 부분에 집중하면서 위함이다. 어차피 model 은 필요하기 때문에 pytorch tutorial 을 이용하도록 하자.
오픈소스 모델 내의 소스코드를 분해해보는 등 개인의 성장과 밀접하게 관련된 행위에 대한 갈증을 느낄 수 있다. 하지만 그것을 할 수 있는 시간은 미래에 충분히 보장되어 있으므로, 이번 마일스톤에서 검증하고자 하는 것을 기간 내에 검증하는 일에 최선을 다하자.