//
Search
🚩

Mask R-CNN 오픈소스를 이용한 COCO 데이터셋 training 가능 여부 테스트

상태
Done
담당
마감일
2022/10/14
요약
선행 태스크
선행 태스크 상태
관련 마일스톤
3 more properties

TODO list

COCO2017 데이터셋 준비
Mask R-CNN 오픈소스 선정 (베이스라인 모델 선정)
서버 환경 세팅
학습 가능 여부 확인
스코어 확인

기타 세부 설명

Simple Mask-RCNN 오픈소스 사용 https://github.com/Okery/PyTorch-Simple-MaskRCNN
mmdetection 이라는 detection 모델 사용이 유용한 오픈소스를 이용하면 좋을 것으로 생각 https://github.com/open-mmlab/mmdetection
사용근거
pytorch 구현체
COCO dataset 바로 사용 가능
Pyramid Mask Text Detector 논문에서 Mask R-CNN 기반이라 명시를 해 두었으므로, 추후에 도움이 될 것으로 예상
Instance segmentation의 기초 지식에 해당하는 논문
10/13 데일리 스크럼
Mask R-CNN 오픈소스 사용 건
coco2017 파일 못 찾는 문제로 학습 못하고 있음, 원인 파악 중 > 제일 큰 문제
인퍼런스 진행을 해야하면 코드 작성 필요
coco full dataset을 coco small dataset으로 바꿔주는 오픈소스
small set으로 바꿔주긴 하나, annotation json 파일의 포맷이 기존과는 다름.
full dataset으로 학습하는 것도 그다지 오래 걸리진 않는 것으로 보임 (12초/1epoch) > 확실하지 않음
데이터는 다 가지고 있으나 소량의 데이터만 학습하는 방식으로 진행하였음

회고

coco dataset에 대해 이해와 실습이 필요함.
논문 구현을 위해 mask r cnn 이해와 실습이 필요
경태파트장님 조언 : mask r cnn은 4포인트 위치를 학습하고 여러 포인트로 segmentation 하는 알고리즘이지만 AIhub의 OCR은 4포인트 위치학습, 4포인트 segmentation하는 알고리즘임.
mmdetection 오픈소스가 잘 파악되면 한 층 수월할 것으로 생각됨. > 굳이 하지 않아도 됨.