//
Search
✍🏻

[1_6.3] 보고서/증빙자료에 필요한 내용을 모두 작성하고, 필요한 경우 도움을 요청한다.

상태
In progress
담당
이장후
이장후
Beeline
Beeline
마감일
2022/11/29
요약
이수화박사님 혹은 권팀장님이 컨펌하시면 완료.
선행 태스크
선행 태스크 상태
후행 태스크
관련 마일스톤
2 more properties
시험 환경 로그 6종 캡쳐 화면
CPU 사양 캡쳐 화면
장후
선직
GPU 사양 캡쳐 화면
장후
선직
RAM 사양 캡쳐 화면
장후
선직
HDD 용량 캡쳐 화면
장후
선직
OS 버전 캡쳐 화면
장후
선직
사용 프레임워크 버전 정보 캡쳐 화면
장후
선직
@이장후 캡쳐 화면
@Beeline 캡쳐 화면
검증 환경 준비 확인서
다른 내용은 아래 칸반에서 확인
이수화박사님 @11/28/2022 : 굿모닝! 이수화입니다. 머신러닝으로 수고가 많으십니다! 다름아니오라, 결과보고서에 모델B 기술내용을 수정제출해야해서, 현재 모델C 만드시는 내용을 기존 모델B에 엎어서 수정해주십사 부탁올립니다. 천천히 한두번 읽어보시고, <붉은색>부분을 현재 제작중의 모델알고리즘으로 수정해주시면 되겠습니다. 그림도 안맞는건 없애버리고, 만드시는거 데이터 흐름도 같은거 넣으시면 됩니다. 감사합니다. 이수화 올림
구축계획서_5장_모델링.hwp
1275.5KB

모델C 논리 관련: 구축계획서 5장 모델링 @11/29/2022, 2:58:00 PM

본 과제에서 사용할 문자 영역 검출, 인식 모델은 크게 두 가지로 구분되며 문자 영역 검출의 경우 기존의 Object Detection과는 다른 부분이 존재함. Text Detection의 경우 Back Bone Model을 통해 Feature Extraction에서 얻는 정보량 보다, Neck, Head Operation에서 얻는 정보량이 중요하기 때문에 Back Model은 계산량이 많이 필요한 Transformer (e.g, Swin Transformer, Vision in Transformer)와 보다 연산량이 적은 CNN Based model 과 성능의 차이가 크지 않기 때문에 Back bone Model은 ResNet Series를 선택함.
본래 구축계획서상에는 Text Detection model 로 PMTD를 사용하고자 했었지만 PMTD는 비-직사각형 Quadrilateral 문자 영역을 사람이 레이블링하면서 생겨나는 문제를 경감시키고자 만들어졌다는 점을 고려해볼 때 (PMTD는 Over-simplified supervision, Imprecise segmentation labels, Error propagation 3가지의 문제점을 해결하기 위해 Data augmentation, RPN Anchor, Pyramid Label, Plane Clustering과 같은 Operation을 개선 및 추가하여 문자 영역 인식에 보다 강건한 성능을 보임) (1) 금융 문서 및 물류문서의 도메인 특성상 비-직사각형 Quadrilateral 텍스트 영역이 존재하지 않고, (2) 템플릿으로 생성된 데이터가 90% 가량 포함되었지만 복잡도가 높지 않아 사람의 레이블링 오류를 찾을 수 없는 이번 과제에 적절하지 않다고 판단함. 대신 PMTD 와 마찬가지로 segmentation based method 를 채택하고 있는 real-time 모델을 사용해서도 충분히 fitting 시킬 수 있는지 확인하고자 DBNet 을 후보군으로 선택함.
(문자 인식 모델의 경우 Transformer기반의 모델인 2d self attention모델을 선정함 특히 2d self attention모델은 세로/가로 문자의 인식이 가능하며 특히 Scene text recognition arbitrary shapes, Transformer for visual tasks 를 수행함으로 기존보다 강건한 문자인식에 성능을 보여줌으로 후보군으로 선택함.)
@이장후 : 안녕하세요 박사님, 제가 아직 논문에 대한 이해도가 모자라서 최대한 채워 본다고 채웠는데 박사님이 보시기에 모자라 보일 수 있을 것 같습니다. 지금 상황이 우선 detection 모델은 어쩔 수 없이 구축계획서와 다른 모델을 써야 하는 상황이고 (모델 B 의 PMTD 대신 DBNet) recognition 모델같은 경우 구축계획서에 제시했던 모델을 사용할 수 있는데, 시간이 조금 부족한 상황입니다. 그래서 전달드린 내용에도 아직 recognition 관련부분을 채워두지 않았습니다.
이수화박사님: 일단 2d self attention으로 문서 마무리하고 일이 진행되는거 봐서 조정하십시다

모델C 유효성 검증 환경 증빙자료 준비

@이장후 준비
@Beeline 취합
이수화박사님 or 권팀장님 컨펌