TODO list
COCO2017 데이터셋 준비
Mask R-CNN 오픈소스 선정 (베이스라인 모델 선정)
서버 환경 세팅
학습 가능 여부 확인
스코어 확인
기타 세부 설명
•
◦
mmdetection 이라는 detection 모델 사용이 유용한 오픈소스를 이용하면 좋을 것으로 생각
https://github.com/open-mmlab/mmdetection
•
사용근거
◦
pytorch 구현체
◦
COCO dataset 바로 사용 가능
◦
Pyramid Mask Text Detector 논문에서 Mask R-CNN 기반이라 명시를 해 두었으므로, 추후에 도움이 될 것으로 예상
◦
Instance segmentation의 기초 지식에 해당하는 논문
•
COCO dataset 사용가능
https://github.com/giddyyupp/coco-minitrain
10/13 데일리 스크럼
•
Mask R-CNN 오픈소스 사용 건
◦
coco2017 파일 못 찾는 문제로 학습 못하고 있음, 원인 파악 중 > 제일 큰 문제
◦
인퍼런스 진행을 해야하면 코드 작성 필요
•
coco full dataset을 coco small dataset으로 바꿔주는 오픈소스
◦
small set으로 바꿔주긴 하나, annotation json 파일의 포맷이 기존과는 다름.
◦
full dataset으로 학습하는 것도 그다지 오래 걸리진 않는 것으로 보임 (12초/1epoch) > 확실하지 않음
◦
데이터는 다 가지고 있으나 소량의 데이터만 학습하는 방식으로 진행하였음
회고
•
coco dataset에 대해 이해와 실습이 필요함.
•
논문 구현을 위해 mask r cnn 이해와 실습이 필요
◦
경태파트장님 조언 : mask r cnn은 4포인트 위치를 학습하고 여러 포인트로 segmentation 하는 알고리즘이지만 AIhub의 OCR은 4포인트 위치학습, 4포인트 segmentation하는 알고리즘임.
•
mmdetection 오픈소스가 잘 파악되면 한 층 수월할 것으로 생각됨. > 굳이 하지 않아도 됨.