#3. 기계학습 수학 1

2022. 11. 1. 15:40
Update Log
| 22.09.16. First Upload
| 22.10.11. Second Upload

 


기계학습에서 수학의 역할
  • 이번 시간에는 기계학습에서 사용되는 수학의 역할을 알아볼 것이다.
  • 수학은 목적함수(손실함수)를 정의하고 목적함수가 최저가 되는 점을 찾아주는 '최적화 이론'을 제공한다.
  • 최적화 이론에 규제, 모멘텀, 학습률, 멈춤 조건과 같은 제어를 추가해서 알고리즘을 구축한다.
  • 이때 사람은 알고리즘을 설계하고 데이터를 수집한다.

벡터

벡터의 표현

  • 우리는 샘플 (sample) 들을 이제부터 특징벡터(Feature Vector)로 표현할 것이다.
  • 예)
    • 아이리스 데이터셋에서 꽃받침의 길이, 꽃받침의 너비, 꽃잎의 길이, 꽃잎의 너비라는 4개의 특징이 있다.
    • 위의 그림에서는 ( 5.1, 3.5, 1.4, 0.2) 인 샘플을 나타낸다.

 

여러개의 특징벡터를 첨자로 구분

  • 여러 가지 특징 벡터가 나올 때는 다음과 같이 x1, x2 ... 처럼 첨자로 구분할 수 있다.
  • 이때 벡터를 표현할때 소문자 x를 가장 많이 사용하며, 볼드체를 사용한다.

행렬

행렬

  • 행렬은 다음과 같이 행과 열로 이루어진 여러 개의 벡터를 담은 표현고 할 수 있다.
  • 훈련 집합 (Training set)을 담은 행렬설계 행렬 (Design Matrix)이라고 부른다.
  • 간단하지만 위의 그림과 같이 가로가 행,그리고 세로가 열이라고 생각하면 된다.
  • 다음 그림은 아이리스 데이터에 있는 150개의 샘플을 설계 행렬 X로 표현한 것이다.
  • 이때 행렬 대문자 X로 표시하고, 볼드체로 쓴다.

 

 

 

전치행렬

전치행렬

  • 전치 행렬은 대각선을 기준으로 싹 다 대칭시킨다고 생각하면 된다.
  • 열이 행이된다고 생각하면 된다.
  • A 행렬이 있다고 했을 때 a11, a22, a33... 와 같이 대각선에 있는 원소들을 기준으로 대칭을 시켜서 반대로 만들면 된다.
  • 굳이 정사각 행렬이 아니어도 되며, 가상의 대각선이 있다고 생각하면 편하다.

 


특수한 행렬

특수한 행렬들

  • 정사각 행렬, 정방행렬 (square matirx)
    • 행개수 == 열개수인 행렬
  • 대각 행렬 (diagonal matrix)
    • 대각요소를 제외하고 모두 0인 행렬
  • 단위행렬 (identity matrix)
    • 대각요소값이 모두 1이고 나머지가 0인 행렬
  • 대칭 행렬 (symmetric matrix)
    • 대각요소 기준으로 서로 대칭인 값을 가지는 행렬

 


다항식의 행렬적 표현

다항식의 행렬 표현

다음과 같이 행렬을 이용하면 수학을 간결하게 표현할 수 있다.


행렬 연산

행렬 연산에서 두 가지를 알아보자

행렬 곱셈 벡터의 내적에 대해서 알아보자.

 

행렬 곱셈 (Matrix Product, Dot Product)

행렬의 곱셈

 

행렬의 곱셈의 예제

  • 행렬의 곱셈은 행렬의 내적이다.
  • A의 열수는 = B의 행수여야 곱이 가능하다.
  • 행렬의 곱셈에서의 특징으로 2가지가 있다.
    • 교환 법칙 성립하지 않는다. 즉 AB!= BA
    • 분배 법칙과 결합 법칙은 성립한다. A(B+C) = AB + AC이고 A(BC) = (AB) C이다.

 

 

벡터의 내적

벡터의 내적

  • 벡터를 내적 했을 때 첫 번째 벡터를 전치 행렬로 바꾸고 두 벡터를 곱하면 된다.

텐서(Tensor)

텐서

  • 3차원 이상의 구조를 가진 숫자 배열
    • 0차 : 수(스칼라)
    • 1차 : 벡터
    • 2차 : 행렬
    • 고차원 : 예) 3차원 구조의 RGB 칼라영상

 


놈과 유사도

벡터의 P차 놈

벡터의 P차놈

  • 다음과 같이 p차 놈을 구하는 이유는 벡터와 행렬의 크기를 놈으로 구하는 것이다.
  • 예시를 들어서 이해하는 편이 훨씬 빠를 것이다.

 

벡터의 P차 놈 예시

 

행렬의 프로베니우스 놈(Frobenius Norm)

  • 행렬의 프로베니우스 놈이다.
  • 구하는 방법을 알아놓고, 그리고 예시를 통해서 한번 구해보자.

행렬의 프로베니우스 놈

 

유사도와 거리

벡터를 기하학적으로 해석

  • 벡터를 기하학적으로 해석한다고 생각하면 된다.
  • 이 이야기는 우리가 그동안 배웠던 개념에 따라서 코사인 유사도를 생각해 볼 수도 있다.

코사인 유사도


선형 결합과 벡터 공간
  • 벡터
    • 공간상의 한 점으로 화살표 끝이 벡터의 좌표에 해당한다.
  • 선형 결합이 만드는 벡터 공간
    • 기저 벡터 a와 b의 선형 결합으로 이루어 진다고 생각하면 된다.

기저벡터 a 와 b의 선형결합
벡터의 연산

  • 다음과 같이 벡터의 연산을 그래프 적으로 해석하면 다음과 같고

 

벡터 공간

  • 선형결합으로 만들어지는 공간을 벡터 공간이라고 부른다.

역행렬
  • 행렬의 연산에서 다루는 것들 중 자주 쓰이는 것이 역행렬이다.
  • 일단 역행렬의 원리부터 알아보자.

역행렬의 원리

  • 다음과 같이 원래 행렬 A와 역행렬 A^-1을 곱했을 때 단위행렬이 나오는 것을 우리는 역행렬이라고 부르기로 했다.

역행렬의 정의

 

  • 예시를 생각하면서 공부를 하면 훨씬 빠를 수도 있을 것이다.

역행렬 예시

'STUDY > 인공지능' 카테고리의 다른 글

#6. 다층 퍼셉트론 및 딥러닝 기초  (0) 2022.11.01
#5. 최적화 이론  (1) 2022.11.01
#4. 기계학습 수학2  (1) 2022.11.01
#2. 기계학습 복습 2  (1) 2022.11.01
#1. 기계학습 복습 1  (1) 2022.11.01

BELATED ARTICLES

more