이런 메타데이터는 확장성 있게 설계되어야 한다. v1, v2 가 올라가더라도 이전 버전의 메타데이터를 사용하는 사용자가 새로운 메타데이터를 사용하는 데 문제가 없어야 한다.
정형 방식이나, 트리 방식과 같이, 카테고리를 나누는 방식으로 설계했다가는 - 딥러닝 기술이 발전하면 발전할수록 레이블을 이렇게 저렇게 자유자재로 활용할 수 있으며 (e.g. 특징을 레이블에 다 담기보다, 카테고리로 나누어 추가적인 supervision 을 줄 수 있음. 의류_신발 → 의류/신발) 어떤 형상을 항상 특정한 카테고리에 끼워넣을 수 없기 때문에 (e.g. 신발은 의류인가, 패션잡화인가?) - 이 레이블 관리시스템을 잘못 설계하면 딱 최신 트렌드와 과거 알려진 지식들에 최적화되어 설계되었기 때문에 1~2년정도만 잘 쓰고, 그 기간이 지나면 그냥 뒤죽박죽 폴더 그 이상도 이하도 아니게 될 수 있다. 기존 카테고리와 안 맞으면, 새로운 폴더를 또 만들 것이다. 기존 데이터들을 다 어떻게 할 것인가? 복사해 넣을 셈인가? 새로운 메타데이터에 포인터 역할을 하는 정보를 넣고, 과거 데이터를 하나하나 찾으며 연결지어줄 것인가?
확장성 있는 설계에 대해서는 프로그래밍에서 매우 오랫동안 고민된 요소이고 "클린코드"에서도 굉장히 강조되는 부분이다 (참고2, 3). 프로그래밍을 넘어 지식의 본질과 사람의 생각이 어떻게 발전하는지에 대한 고민을 오랫동안 해왔으니까 (참고1), 이들을 참고해서 개발하면 좋을 것 같다.
참고
3.
to
1.