[Math4CV-9] Linear transformations

2021-03-09

Linear transformations of vector spaces - Ánh xạ tuyến tính

Cho ma trận $\mathbf{A} \in \mathbb{R}^{m \times n} $. Có thể sử dụng ma trận $\mathbf{A}$ để chuyển đổi từ không gian $\mathbb{R}^{n \times 1} $ vào không gian $ \mathbb{R}^{m \times 1} $ bằng phép nhân ma trận:

\[\mathbf{y} = \mathbf{A} \mathbf{x}\]

Vector cột $ \mathbf{x} \in \mathbb{R}^{n \times 1} $ được chuyển thành vector cột $ \mathbf{y} \in \mathbb{R}^{m \times 1} $ bằng cách nhân với ma trận $\mathbf{A}$.

\[y_i = a_{i1}x_1 + a_{i2}x_2 + ... + a_{im}x_m = a_{i*} \cdot \mathbf{x}\]

Phần tử thứ $i^{th}$của vector $\mathbf{y}$ bằng dot product của hàng $i^{th}$ ma trận $\mathbf{A}$ với vector cột $\mathbf{x}$.

Chú ý: Nếu chúng ta biểu diễn data dưới dạng ma trận $\mathbf{X}$ với mỗi cột là một example, lúc này áp dụng linear transformation với ma trận $\mathbf{A}$ lên data $\mathbf{X}$ ta nhận được transformaed data $\mathbf{Y}$:

\[\mathbf{Y} = \mathbf{A} \mathbf{X}\]

Lúc này mỗi cột của ma trận $\mathbf{Y}$ tương ứng với một example mới.

Bất kỳ ánh xạ (transformation) nào cũng được đặc trưng bởi 2 không gian con. Một cái được gọi là Kernel hay (null space of transformation), một cái được gọi là Range hay image space of transformation.

Kernel của matrix $\mathbf{A} \in \mathbb{R}^{m \times n}$ (hay kernel của transformation) là tập con của $\mathbb{R}^{n \times 1}$:

\[Ker(\mathbf{A}) = \left\{ \mathbf{x} \in \mathbb{R}^{n \times 1}: ~~\mathbf{A}\mathbf{x} = 0 \right\}\]

Kernel của matrix $\mathbf{A}$ là không gian con tuyến tính của $\mathbb{R}^{n \times 1}$.

Range của matrix $\mathbf{A} \in \mathbb{R}^{m \times n}$ là tập con của $\mathbb{R}^{m \times 1}$:

\[Range(\mathbf{A}) = \left\{ \mathbf{y} \in \mathbb{R}^{m \times 1}: \text{tồn tại} ~ \mathbf{u} \in \mathbb{R}^{n \times 1}, \mathbf{y} = \mathbf{A} \mathbf{u} \right\}\]

Range của matrix $\mathbf{A}$ là không gian con tuyến tính của $\mathbb{R}^{m \times 1}$.

Formula of dimension

\[\dim(Ker(\mathbf{A})) + \dim(Range(\mathbf{A})) = n\]

Số chiều của $Range(\mathbf{A})$ bằng với $Rank(\mathbf{A})$. Thực chất $Range(\mathbf{A})$ là span các cột của matrix $\mathbf{A}$.

\[Range(\mathbf{A}) = span(a_{*1}, a_{*1}, \dots, a_{*n})\]

Để tìm ảnh của bất kì vector $\mathbf{x} \in \mathbb{R}^{n \times 1}$ bằng ánh xạ qua matrix $\mathbf{A}$ chúng ta đi tìm ảnh các của vector của cơ sở chuẩn $\mathbf{u}_1, \mathbf{u}_2, \dots, \mathbf{u}_n$ của không gian $\mathbb{R}^{n \times 1}$:

\[\mathbf{x} = (x_1, x_2, \dots, x_n)^T = x_1 \mathbf{u}_1 + x_2 \mathbf{u}_2 + \dots + x_n \mathbf{u}_n\]

Do đó

\[\mathbf{A} \mathbf{x} = x_1 \mathbf{A}\mathbf{u}_1 + x_1 \mathbf{A}\mathbf{u}_1 + \dots + x_n \mathbf{A}\mathbf{u}_n\]

Theo định nghĩa của cơ sở chuẩn $\mathbf{A}\mathbf{u}_i$ chính là cột $a_{ * i}$ của matrix $\mathbf{A}$.