Search
🔵

ba2.4.1. title: 피처 저장소(‣)는 모델에 입력될 수 있는 형태의 전처리 결과물 등을 재활용할 수 있도록 만들어둔 저장소이다.

생성
🚀 prev note
🚀 next note
14 more properties
그림(참고5): 피처 저장소에서 의미하는 ‘피처’ 가 무엇인가
예를 들어 원시 데이터로부터 (1)우버를 호출할 것으로 예상되는 고객의 위치, (2)그 당시 근처 우버 운전자의 위치, (3)고객과 우버 운전자의 매칭 여부가 10분간 1분 단위로 상대적 위치를 계산한 10차원 데이터(x)와 정답값(y)로 변환된 후 미켈란젤로의 피처 저장소에 자동으로 적재되는 ETL 파이프라인이 있다고 생각해 보자. 데이터 과학자들은 모델을 학습시키고자 할 때 전처리에 대한 큰 고민 없이 피처 저장소에 잘 정제된 데이터를 꺼내서 사용하기만 하면 될 것이다.
피처 저장소를 사용하면 데이터 사이언티스트와 데이터 엔지니어의 업무가 잘 분리되어 각자의 일에 더욱 집중할 수 있고, 특정 프로젝트에 의존되지 않을 수 있다는 장점이 있다(참고2,3). 피처 저장소에 데이터를 쌓아 주는 쪽은 데이터 엔지니어, 피처 저장소에 들어있는 데이터를 적극적으로 이용하는 쪽은 데이터 사이언티스트에 가깝다.
그림 (참고1)
parse me : 언젠가 이 글에 쓰이면 좋을 것 같은 재료들.
from : 과거의 어떤 생각이 이 생각을 만들었는가?
1.
2.
3.
피처 스토어는 메모이제이션 패턴과 연관이 있다고 생각할수도 있다. 앞선 글에서 설명하는대로 TF-IDF행렬이 미리 만들어서 피처 스토어에 저장되어 있다면 이것을 그냥 불러와 사용하기만 될 것이다.
supplementary : 어떤 새로운 생각이 이 문서에 작성된 생각을 뒷받침하는가?
opposite : 어떤 새로운 생각이 이 문서에 작성된 생각과 대조되는가?
1.
None
to : 이 문서에 작성된 생각이 어떤 생각으로 발전되고 이어지는가?
참고 : 레퍼런스