🌍

b3.4_5.1_2.1_2_1.1.1. title: 데이터의 둘 이상의 특징값에 상관관계가 있어 데이터 행렬 X에 잉여 행벡터(‣)가 존재하는 경우 의사역행렬을 이용할 수 없다.

생성

prev summary

🚀 prev note

♻️ prev note

next summary

🚀 next note

♻️ next note

관련 임시노트

9 more properties

의사역행렬을 이용해 값을 구하려면(from1) 행렬이 redundant(참고4) 하지 않아야 한다(참고1)는 것이 무슨 의미일까? 처음부터 생각해 보자. 우리가 만족시켜야 하는 식은 당연히

Xw=y

이다.

n

개의 특징을 가진

m

개의 데이터를

X_{(n,m)}

행렬에 담아 넣었다. 이를 이용해 우리는 파라미터

w

를 추정하고 있다. 여기서 중요한 것은

X

가 (특징, 데이터의 수) 로 구성된 행렬이라는 것이다. 이때, 만약

m

개의 데이터에 대한 특징을 두 개를 선택해 보자. 그럼 두 개의 벡터가 나올텐데, 이들은 모두 당연히 길이가

m

인 열벡터일 것이다. 이 두 벡터가 선형독립이 아니라면, 선형변환

X

의 변환 후 기저벡터의 개수가 이전과 동일하지 않으므로 차원이 붕괴(from2)되어 역행렬이 존재하지 않게 된다(참고3).

그래서 다음과 같은 이야기가 나온 것이다.

한 가지 예를 본다면 만약에 x1을 엔진 파워 값으로 쓰되 x2라는 두 번째 파라미터를 이와 같이 2x 엔진 파워처럼 그냥 단지 2를 곱해준 단순한 비례 관계에 있는 값을 특징값으로 사용하면 그런 문제가 발생하게 되고, 그럴 경우에 이런 문제를 피하기 위해서는 특징 값이 데이터 수보다도 더 많아야 됩니다. 따라서 데이터를 좀 더 많이 얻거나 또는 특징 값을 몇 개 없애거나 아니면 regularization, 즉 정규화 방식을 쓰거나 함으로써 이런 문제를 피할 수가 있습니다.(참고2)

데이터를 많이 모으면 행렬

X

에서 두 열벡터가 완벽하게 선형독립일 가능성이 월등히 낮아질 것이다. 아무리 데이터의 두 특징 사이에 상관관계가 존재한다고 하더라도 실세계에는 노이즈가 있기 때문이다. 그래서 데이터를 더 많이 모으는 것도 행렬에 잉여 벡터(‣ Redundant vector)를 만들지 않는 방법이 될 수 있다(참고2,3).

parse me : 언젠가 이 글에 쓰이면 좋을 것 같은 재료들.

None

from : 과거의 어떤 생각이 이 생각을 만들었는가?

supplementary : 어떤 새로운 생각이 이 문서에 작성된 생각을 뒷받침하는가?

None

opposite : 어떤 새로운 생각이 이 문서에 작성된 생각과 대조되는가?

None

to : 이 문서에 작성된 생각이 어떤 생각으로 발전되고 이어지는가?

None

참고 : 레퍼런스

이와 같이 X^TX 행렬이 역행렬을 가지고 있지 않을 때 우리는 이 방법을 사용할 수 없고, 따라서 우리가 원하는 최적 파라미터는 구할 수가 없습니다. 그러면 이와 같은 문제를 우리는 Non Invertibility Problem이라고 부르는데요. 언제 그런 경우가 발생하는가 하면 우리가 사용하는 특징 값들이 Redundant 할 때, 그러니까 너무 비슷한 데이터를 특징 값으로 사용할 때 이런 현상이 발생할 수 있습니다.

한 가지 예를 본다면 만약에 x1을 엔진 파워 값으로 쓰되 x2라는 두 번째 파라미터를 이와 같이 2x 엔진 파워처럼 그냥 단지 2를 곱해준 단순한 비례 관계에 있는 값을 특징값으로 사용하면 그런 문제가 발생하게 되고, 그럴 경우에 이런 문제를 피하기 위해서는 특징 값이 데이터 수보다도 더 많아야 됩니다. 따라서 데이터를 좀 더 많이 얻거나 또는 특징 값을 몇 개 없애거나 아니면 regularization, 즉 정규화 방식을 쓰거나 함으로써 이런 문제를 피할 수가 있습니다.

본지가 좀 되어서… 우선 redundant 가 있다는 의미는 ‘해가 존재하지 않는다’ 는 의미일거에요. 무슨이야기냐면, Least Squre의 경우에는 미지수의 갯수보다 데이터의 갯수가 더 많습니다. 이런 경우라면, 해는 더 높은 차원에 존재하는데, 미지수의 갯수는 그것보다 적으니 최소제곱이라는 것은 미지수의 갯수만큼의 plane에 사영시키는 것과 같습니다. 그때 최적이라는게 최소제곱법의 원리였구요. -야옹야아옹

8:15, 그럼 세 번째 벡터가 두 벡터의 스팬 위에 놓여 있거나, 두 벡터의 스팬이 이미 선인 경우라면, 이런 상황에는 적어도 하나 이상의 불필요한(redundant) 벡터가 있다고 한다. 즉, 스팬의 축소 없이 하나 이상의 벡터를 제외시켜도 되는 경우, 전문 용어로 이를 선형 종속(linearly dependent) 이라고 한다. 반면, 각각의 벡터가 기존 스팬에 또다른 차원을 추가해주는 것이 가능하다면 이를 선형 독립(linearly independent) 이라고 한다.