⛳

마일스톤1 (성공)

상태

Done

담당

이장후

Beeline

마감일

2022/10/14

요약

작은 규모의 COCO 포맷 데이터셋을 이용해서 베이스라인 모델의 결과를 만드는 파이프라인을 도커로 패키징한다.

선행 태스크

선행 태스크 상태

후행 태스크

관련 마일스톤

하위 태스크

1 more property

문제	프로젝트를 수행할 수 있을지 없을지 감이 잘 안 잡힌다. 논문을 구현하는 일 자체도 꽤 많은 시간을 차지하지만, 구현 이외의 다른 기술적인 작업에 얼마나 많은 시간이 필요할지 전혀 모른다는 것이 프로젝트 진행 여부 판단을 가로막는다.
해결	전체 사이클을 최대한 쉽고 크게 한 번 돌아보면서, 어떤 부분에서 시간이 오래 걸리게 될지를 파악해볼 필요가 있다.
목적	과제를 수행할 수 있는지 우리의 능력을 파악하기 위함이다. (마일스톤1을 실패할 경우 프로젝트 성공확률이 0% - )
마일스톤 목표	작은 규모의 COCO 포맷 데이터셋을 이용해서 베이스라인 모델의 결과를 만드는 파이프라인을 도커로 패키징한다.

순서대로 가기는 어렵다. 왜냐하면, 원시 데이터와 관련된 검증은 우리의 의지와 상관없이 들어올 때마다 작업을 해 주어야 한다. 데이터 로더나 coco 변환기는 경태파트장님이 가지고 있어서 우리가 핸들링 불가능하기 때문이다.

•

업무 분할

◦

@Beeline 

▪

오픈소스, 완전 간단한 모델 (되도록이면 논문의 baseline 이면 좋을 것 같음)

•

모델선정

▪

그 오픈소스가 사용하는 데이터 포맷

•

coco data format

▪

데이터 100장 (coco-small 이면 좋을 것 같음)

•

데이터수집

▪

학습 가능한 상태

•

선정한 모델 구현

•

training, validation 코드 작성

▪

스코어 추출 가능한 상태

•

커맨드 >> result.txt

▪

도커 패킹

◦

@이장후

▪

아래 구성 요소들을 도커로 패킹하여 컨테이너로 만들고, 커맨드 하나만으로 도커 컨테이너를 켜고 학습이 시작되도록 만든다.

•

pytorch classification tutorial - model

•

pytorch classification tutorial - dataset

▪

하는 이유

•

머신러닝 프레임워크나 모델의 복잡성을 잠깐 묻어 두고, docker 부분에 집중하면서 위함이다. 어차피 model 은 필요하기 때문에 pytorch tutorial 을 이용하도록 하자.

오픈소스 모델 내의 소스코드를 분해해보는 등 개인의 성장과 밀접하게 관련된 행위에 대한 갈증을 느낄 수 있다. 하지만 그것을 할 수 있는 시간은 미래에 충분히 보장되어 있으므로, 이번 마일스톤에서 검증하고자 하는 것을 기간 내에 검증하는 일에 최선을 다하자.