모델A | 모델B | 모델C | |
detection 구현 | A1 (구현 완료, 경태파트장님) | B1 (외부 리소스) | , |
recognition 구현 | A2 (구현 완료, 경태파트장님) | B2 (외부 리소스) | , |
비고 | 나머지 데이터에 대한 학습 필요 | (리소스 탐색) 박사님, 팀장님, 실장님 | (모델 선정 근거) 후천적으로 논문 이야기 이어붙이기 + 이수화박사님 |
금융 10% / 경태파트장님 모델 A | 물류 1% / 경태파트장님 모델 A | ICDAR 2015 1% / MMOCR 모델 C | 금융 1% / MMOCR 모델 C | 물류 1% / MMOCR 모델 C | 금융 1% / PMTD 모델 B | |
해보는 이유 | - | - | - 금융데이터와 물류데이터가 너무 더러움
- MMOCR data zoo 에서 ICDAR 데이터셋을 사용할 수 있음.
- MMOCR 데이터 로더가 ICDAR 데이터 포맷을(COCO) 제공함. | - | - | - |
디렉토리 정리하기 | obsidian
/mnt/data/aihub2022/raw/finance/20_of_100
overload
/data/aihub2022/raw/finance/part_20_of_100 | obsidian
/mnt/data/aihub2022/raw/transit/10_of_100 | obsidian
/mnt/data/aihub2022/raw/icdar2015/ | |||
모델 체크포인트를 덮어쓰지 않는 방법에 대해 알아보기 | o | o | ||||
금융데이터 20% 다운로드 | o | o | ||||
물류데이터 10% 다운로드 | o | o | ||||
ICDAR 2015 데이터 다운로드 | o | |||||
데이터를 COCO 포맷으로 변경 | o | o | ||||
데이터 샘플링 | o, 10% | o, 1% | o, 1% | o, 1% | o, 1% | |
금융데이터 100장 시각화 | o | |||||
물류데이터 100장 시각화 | o | o | o | |||
ICDAR 2015 데이터 100장 시각화 | o | |||||
COCO포맷의 데이터를 경태파트장님 모델의 학습포맷으로 변경 | o | |||||
COCO포맷의 데이터를 MMOCR 모델의 학습포맷으로 변경 | o | o | ||||
금융데이터 20% 파트장님 모델 학습 및 평가 | o | |||||
물류데이터 1% 파트장님 모델 학습 및 평가 | o | |||||
MMOCR detection 모델 구축 - config 설정들에 신경쓰며 | o | o | o | |||
MMOCR detection 모델 학습 및 평가 | o, model zoo 에 명시된 내용들과 비교하여 모델이 올바르게 만들어졌는지 확인 | o, 파트장님 모델과 비교 | o, 파트장님 모델과 비교 | |||
MMOCR end2end 모델 구축 - config 설정들에 신경쓰며 | o | o | o | |||
MMOCR end2end 모델 학습 및 평가 | o, model zoo 에 명시된 내용들과 비교하여 모델이 올바르게 만들어졌는지 확인 | o, 파트장님 모델과 비교 | o, 파트장님 모델과 비교 |
아이데이션