디어코퍼레이션 / 로보틱스 엔지니어

기간

2020/11/01 → 2022/04/15

2 more properties

컴퓨터비전 기반 자율주행으로 이끌었습니다.

자율주행 및 자율주차 킥보드 프로토타입을 개발했습니다.

데이터가 없는 상태에서 자율주행을 개발하는 행동의 한계를 지적했습니다.

연구를 넘어 상용화에 대해 깊게 고민했습니다.

자주 받았던 질문들

머신러닝 프레임워크로 파이토치 대신 텐서플로를 사용한 이유가 무엇인가요?

ROS2가 아닌 ROS1을 사용한 이유가 무엇인가요?

자율주행 킥보드를 만들면 사람이 탈까요?

왜 SLAM 기반의 접근을 포기해야 한다고 생각했나요?

컴퓨터비전 기반 자율주행으로 이끌었습니다.

vision

path planning (based on vision)

3개의 RGB-D 카메라가 부착된 루돌프 2세대

자율주행 킥보드 개발 초기 단계에서, ORB-SLAM 을 기반으로 돌아가는 시스템을 고도화시키는 수준으로는 현실의 문제를 풀기 어렵다고 지적했습니다. 팀이 프로젝트의 방향성을 SLAM 기반의 방법이 아닌 Vision Based 로 변경할 것을 제안했습니다. (@12/1/2020 → 2/1/2021)

블로그 <다빈치 작업실> 에 있는 글을 통해 관련된 생각들 보기

자율주행 및 자율주차 킥보드 프로토타입을 개발했습니다.

메이커들과 함께 제작되고 있는 루돌프 프로토타입

사람의 도움 없이, 킥보드가 한번도 보지 못한 길 약 100m 을 주행할 수 있도록 만들었습니다. 공장 초기화된 상태의 Jetson Xaiver AGX 에 간단한 Perception 시스템을 밑바닥부터 구성하고 그 과정을 문서화했습니다. 3개의 카메라에서 작동하는 2가지 태스크를 수행하는 모델을 원활히 관리하기 위해 신경썼습니다. (@2/1/2021 → 11/1/2021)

•

문제

데이터 전처리 전략 - 모델 아키텍쳐 선정 전략 - 모델 훈련 전략 - 태스크 선택 - 대상 카메라 선택 - 모델 최적화 전략 등에 의해 시스템이 수많은 모델 부산물들로 쉽게 더러워졌습니다. 생성되는 모델은 각 전략을 달리 할 때마다 심하게 분화되었고 사용중인 모델의 성능 및 학습 이력 추적도 어려웠습니다. 내가 어떤 카메라에서 사용하는 모델파일이 어떤 과정으로 생성된 모델인지조차 헷갈리는 상황에 이르렀습니다.

딥러닝 인프라를 위한 투자를 할 리소스가 없었습니다. 클라우드에서 최대한 저렴하게 성능 좋은 모델을 훈련시켜야 했습니다.

균일한 간격으로 차선이 그려져 있는 차도환경과 달리, 인도 환경은 그 폭이 다양하고 지면에서 가까운 카메라가 획득할 수 있는 일관된 직선 피처를 찾기가 어려웠습니다. 킥보드의 진행방향과 글로벌 맵의 각도 오차가 누적되는 문제가 있었습니다.

개발 초기에는 Jetson 을 초기화해야 하는 일이 빈번하게 발생했습니다. 하지만 이때마다 과거 개발환경이 사라지는 문제가 있었습니다. 이를 복구하기 위해서는 높은 운과 많은 시간이 따라 주어야 했습니다.

•

해결

빠르고 정확하게 원하는 모델을 원하는 목적으로 골라 사용할 수 있는 파이프라인이 필요했습니다. 생성된 모델들의 이름 컨벤션을 정의, 학습 로그 포맷을 만들어 기록하기, 모델 학습 메타데이터와 연결되는 json 파일을 정의해 사용했습니다.

after

COLAB에서 제공하는 TPUv2x8 을 비롯해 선점형 Google Cloud TPU 는 퍼포먼스에 비해 그 가격이 매우 저렴했습니다. TensorFlow x Google Cloud TPU 를 이용해 딥러닝 인프라에 비용을 거의 들이지 않고 모델을 만들어냈습니다.

시각장애인의 접근성을 위한 인도 위 점자블럭이 상당히 표준화되어 있으며 설치규정이 까다롭다는 것을 알게 되었고 이를 잘 이용할 수 있겠다는 생각이 들었습니다. 킥보드에 설치된 카메라의 각도를 이미 알고 있으므로 ODD를 완전평지라고 가정하면 소실선을 얻을 수 있습니다. 그 다음 ‘인도 보행 데이터셋’ 으로 학습시킨 Segmentation 모델의 출력 중 점자블럭으로 검출된 부분이 안정적으로 검출되면 2D 이미지상에서 직선을 피팅합니다. 피팅된 직선, 글로벌 지도에 나타난 인도의 방향, 소실선이 만나는 점으로부터 센서값으로부터 취득한 헤딩을 보정할 수 있었습니다.

환경 구축 명령어들을 중심으로 최대한 문서화했습니다. 그리고 각 명령어의 실행에 따라 나타나는 변화와 발생했던 이슈들을 문서화했습니다.

•

성과

한번 리눅스가 초기화되고 난 뒤, 환경을 다시 맞추어 과거 코드가 문제없이 돌아가도록 하는데 걸리는 시간을 비교했습니다. 2020년 11월에는 3달이 걸렸지만, 2021년 1월에는 문서화를 통해 1~3일로 줄어들었습니다.

학습 파이프라인을 구동하는 데 준비하는 시간과 학습된 모델을 다운로드받고 실행하는 과정 자체에서 소비되는 시간이 단축됐습니다. 파라미터를 달리해 훈련시키고 엣지 디바이스에 포팅하는 속도를 각각 17배, 4배 단축시켰습니다.

블로그 <다빈치 작업실> 에 있는 글을 통해 관련된 생각들 보기