Til 부스트코스 선형변환 강의 정리
Til 부스트코스 선형변환 강의 정리
title: [TIL] 부스트코스 선형변환 강의 정리 date: 2023-01-11 09:53:48.250 +0000 categories: [부스트코스] tags: [‘프리코스’] description: 벡터를 다루는 연산에서 input x를 output y로 바꾸는 T를 함수(function), 변환(Transformation) 또는 맵핑(mapping)이라 한다.이러한 관계를 다음과 같이 표현할 수 있다.T: x ↦ y함수에서는 x ↦ y의 관계가 반드시 1:1이어 image: /assets/posts/2023-01-11-til-부스트코스-선형변환-강의-정리/thumbnail.png
Transformation
용어 정리
- 벡터를 다루는 연산에서 input
x
를 outputy
로 바꾸는T
를 함수(function), 변환(Transformation) 또는 맵핑(mapping)이라 한다. - 이러한 관계를 다음과 같이 표현할 수 있다.
T: x ↦ y
- 함수에서는
x ↦ y
의 관계가 반드시 1:1이어야 한다. (1개의 input에 대해 반드시 1개의 output이 있어야 함)
Domain(정의역)
- input이 될 수 있는 모든
x
의 집합을 정의역이라 한다.
Co-domain(공역)
- output의 값이 될 수 있는 모든
y
의 집합을 공역이라 한다.
Image
- 주어진
x
에 대한 outputy
를 image라고 한다.
Range(치역)
- 정의역에 있는 모든
x
에 대해 output이 될 수 있는 모든y
의 집합을 치역이라 한다.
Linear Transformation(선형변환)
- 선형변환은 다음의 조건을 만족하는 변환(또는 맵핑)을 말한다.
- 이를 풀어서 설명하면, 두 벡터를 계수 c, d로 선형결합한 것을 변환한 값과, 각각의 벡터를 따로 변환한 뒤 계수를 곱한 값이 같다면, 변환
T
는 선형변환이다.
1차원(non-vector) 변환 예시
T(x) = y = 3x인 함수가 있다고 하면
u, v = 2, 3
(상수),c, d = 4, 5
두 결과가 같으므로
T
는 선형변환이다.
bias가 있을 때 1차원 변환
- 위와 같이 bias가 있을 때는 선형변환이 되지 않는다.
벡터 변환 예시
- 반면 벡터 변환에서는 bias에 상관없이 선형변환이 된다.
선형변환의 행렬
- 결론부터 말하면 모든 선형변환은 어떤 가중치 행렬과 주어진 입력 벡터의 곱으로 나타낼 수 있다.
Standard basis
standard basis
는 한개의 성분만 1이고 나머지는 모두 0개인 n차원 벡터 n개로 구성된 basis를 말한다. standard basis의 span은 n차원의 공간 전체집합을 의미하게 된다.
Standard basis를 이용하여 선형변환의 가중치 행렬 구하기
- 다음의 두가지 단서가 있다면 어떤 변환
T
의 가중치 행렬을 구할 수 있다.T
는 선형변환임- input으로
standard basis
가 주어졌을 때 output
과정
input은 3차원이므로 미지수 벡터
x
는 다음과 같이 3차원standard basis
와 계수의 조합으로 나타낼 수 있다.여기서 column combinations을 이용하면 미지수를 base로, 각 열벡터를 합친 것을 가중치 행렬로 하는 행렬곱으로 나타낼 수 있다.
- 위 수식에서 A 행렬을 선형 변환
T
의standard matrix
라고 한다. m차원 ↦ n차원
변환에서 A는m x n
행렬이 되며 수식으로는 다음과 같이 나타낼 수 있다.
결론
This post is licensed under CC BY 4.0 by the author.