//
Search
👨‍👩‍👦‍👦

진행상황을 공유하고, 외부지원 관련 결정된 내용들을 공유하는 meet

상태
Done
담당
마감일
2022/11/02 → 2022/11/04
요약
선행 태스크 상태
Done
관련 마일스톤
3 more properties
Aihub 관련 질문
1.
Aihub 과제에서 모델을 학습시키는 목적은 데이터 검증이라 이해하고 있습니다. PMTD(모델B1) 대신 다른 모델을 사용하는 방법은 없을까요?
모델A
모델B
문자 영역 인식 (detection)
A1 (구현 완료, 경태파트장님)
B1
문자 해독 (recognition)
A2 (구현 완료, 경태파트장님)
B2
말씀주신 날짜
입장 차이
경태파트장님
@11/1/2022
안 된다. 해당 모델은 제안받은 5개의 모델 중 그나마 쉬운 것으로 2개 선정한 것이지, 내가 임의로 선정한 것은 아니다. 당장에는 넘어가더라도 생각보다 많은 사람들이 해당 코드를 들여다보게 된다. 특히나 PMTD는 오픈소스가 전혀 없는 모델이라 위험성이 특히 크다.
이수화박사님
@11/1/2022
회피할 방법이 있다. 모델을 학습시키는 의도, NIA와의 이해관계 등을 생각해보면 방법은 있을 것이다.
한선호실장님
@11/1/2022
안 되더라도 하자. 구현에 실패하는 경우 사업비를 반환하는 것이 낫다.
김영진팀장님
@11/3/2022
안 되더라도 하자. 구현에 실패하는 경우 사업비를 반환하는 것이 낫다.
변수
어떤 모델을 구현했는지 공개가 되는지 아닌지 모른다.
공개가 되는 경우, 보고서에 작성된 모델을 공개했다고 알려지는 것인지 아닌지 모른다.
PMTD
성능 O
성능 X
구현 O
구현 X
MMOCR
성능 O
성능 X
구현 O
구현 X
-
-
2.
보고서에 보면 학습 GPU 를 적는 칸에 Quadro RTX 6000 24GB (4EA) 가 작성되어 있는데, baikal 은 RTX 3090Ti (2EA) 인 것으로 알고 있습니다. 코그넷나인의 GPU 서버가 여러대인 것이 맞나요? 이중에서도 aihub 과제의 보고서에 작성되어 있는대로 RTX 6000 클러스터를 사용해 학습시켜야 한다면 전체데이터 10만장을 학습시키는 데 시간이 얼마나 걸릴지 궁금합니다. 질문을 드리는 이유는 전체 사이클을 도는 데 반드시 소비되어야 하는 시간을 가늠할 필요가 있기 때문입니다!
3.
작년의 경우에는 모델 웹데모나 앱데모를 구현해야 했었다고 이야기를 들었습니다. 올해는 해당 내용을 신경쓸 필요가 없는 것이 맞을까요?
a.
구현해야 한다. 하지만 선직님과 내가 신경쓸 부분은 아니다.
4.
유니닥스 NAS 에 업로드되어 있는 물류 OCR 데이터가 1차 2차로 나뉘어 있습니다. 이 둘의 차이가 무엇인가요?
1차와 2차를 합치면 전체 구축 데이터의 10% 남짓이다. 둘은 다른 데이터이다. 한 번에 제공해도 되는걸 두 번에 나누어 준 것이다.
@11/4/2022 결론
모델A
모델B
모델C
detection 구현
A1 (구현 완료, 경태파트장님)
B1 (외부 리소스)
,
recognition 구현
A2 (구현 완료, 경태파트장님)
B2 (외부 리소스)
,
비고
나머지 데이터에 대한 학습 필요
(리소스 탐색) 박사님, 팀장님, 실장님
(모델 선정 근거) 후천적으로 논문 이야기 이어붙이기 + 이수화박사님
외부 리소스
구현에 성공하는 경우
구현에 실패하는 경우
모델B
Good
못해도 좋으나, 실패하는 이유에 대한 정보를 정확히 수집해야 함.
이번달 안에는 솔직히 어렵다. 대신 늦어도 12월 안에는 끝내자.
거짓말은 치지 말자. 이 바닥에서 코그넷나인은 실력과 솔직함을 포기해서는 안된다. 차라리 정치싸움으로 가는 것이 낫다.
기타