
인공지능(AI)은 현대 사회에서 빠르게 발전하고 있는 기술 분야입니다.
이 AI의 기반에는 고등학교에서 배우는 수학, 특히 미적분학이 중요한 역할을 하고 있습니다.
이 자료에서는 미적분이 AI에 어떻게 활용되는지 살펴보겠습니다.
기계학습 모델 훈련: 경사 하강법
경사 하강법은 AI 모델을 훈련시키는 핵심 알고리즘입니다. 이 방법은 함수의 최솟값을 찾는 과정과 유사한데, 이를 산에서 내려오는 것에 비유할 수 있습니다.
여러분이 안개 낀 산 정상에 있고, 가장 낮은 지점을 찾아야 합니다. 안개 때문에 멀리 볼 수 없어서, 현재 위치에서 가장 가파른 방향으로 조금씩 내려가는 방법을 선택합니다. 이것이 바로 경사 하강법의 원리입니다.
현재 위치의 경사 = 미분
조금씩 내려가기 = 학습률
AI에서는 '오차'라는 산을 내려가면서 최적의 모델을 찾습니다. 미분을 통해 어느 방향으로 내려가야 할지 결정하고, 학습률을 통해 얼마나 큰 걸음을 뗄지 정합니다.
수학적으로 표현하면, 파라미터 θ에 대한 비용 함수 J(θ)의 업데이트는 다음과 같이 이루어집니다:
θ := θ - α∇J(θ)
여기서 α는 학습률, ∇J(θ)는 비용 함수의 그래디언트(기울기)입니다.
신경망의 활성화 함수: 시그모이드 함수
신경망에서 자주 사용되는 활성화 함수 중 하나인 시그모이드 함수는 학교의 성적 평가 시스템과 비슷합니다.
학교에서는 시험 점수(0-100점)를 최종적으로 A, B, C, D, F로 변환합니다. 시그모이드 함수도 이와 유사하게 작동합니다:
입력: 어떤 실수값
출력: 0에서 1 사이의 값
시그모이드 함수의 수식은 다음과 같습니다:
σ(x) = 1 / (1 + e^(-x))
이 함수는 큰 음수는 0에 가깝게, 큰 양수는 1에 가깝게 만들어주며, 중간 값들은 부드럽게 변화시킵니다.
이런 특성 때문에 신경망에서 정보를 '분류'하는 데 유용하게 사용됩니다.
오차 계산과 역전파: 연쇄 법칙
역전파는 '소문 전달 게임'에 비유할 수 있습니다.
5명의 친구가 일렬로 서서 메시지를 전달할 때, 최종 메시지가 틀렸다면 어디서 잘못됐는지 역순으로 확인하는 것과 같습니다.
신경망의 역전파도 이와 비슷합니다. 출력층의 오차부터 시작해서 역순으로 각 층의 책임을 계산합니다.
이 과정에서 연쇄 법칙이 사용됩니다.
수학적으로, 만약 y = f(g(x))라면, dy/dx = (dy/dg) * (dg/dx)입니다.
신경망에서 이는 다음과 같이 적용됩니다:
∂E/∂w_jk = (∂E/∂y_k) * (∂y_k/∂net_k) * (∂net_k/∂w_jk)
여기서 E는 오차, y_k는 출력, net_k는 뉴런의 가중합, w_jk는 가중치입니다.
확률과 통계 모델링: 정규분포
정규분포는 학생들의 키 분포와 비슷합니다.
전교생의 키를 측정해 그래프로 그리면 종 모양이 나오는데, 이것이 정규분포입니다.
가운데 높은 부분: 평균 키에 해당하는 학생이 가장 많음
양쪽으로 갈수록 낮아짐: 평균에서 많이 벗어난 키의 학생일수록 적음
정규분포의 확률 밀도 함수는 다음과 같습니다:
f(x) = (1 / (σ√(2π))) * e^(-(x-μ)^2 / (2σ^2))
여기서 μ는 평균, σ는 표준편차입니다.
AI는 이런 분포를 이용해 데이터의 특성을 이해하고 예측합니다.
예를 들어, 새로운 학생의 키가 주어졌을 때 그 키가 얼마나 일반적인지 판단할 수 있습니다.
컴퓨터 비전: 소벨 필터
소벨 필터는 사진의 윤곽선을 찾는 방법입니다. 이는 마치 특별한 돋보기로 사진을 살펴보는 것과 같습니다.
가로 방향 돋보기: 좌우로 밝기가 급격히 변하는 곳을 찾음
세로 방향 돋보기: 위아래로 밝기가 급격히 변하는 곳을 찾음
수학적으로, 소벨 필터는 이미지의 각 픽셀에 대해 다음과 같은 연산을 수행합니다:
G_x = [-1 0 1; -2 0 2; -1 0 1] * A
G_y = [-1 -2 -1; 0 0 0; 1 2 1] * A
여기서 A는 이미지의 일부분(3x3 픽셀), *는 컨볼루션 연산을 나타냅니다.
이렇게 찾은 변화가 큰 부분들이 바로 물체의 윤곽선이 됩니다.
AI는 이런 방식으로 이미지에서 중요한 특징들을 추출하고, 이를 바탕으로 물체를 인식하거나 이미지를 분류합니다.
이처럼 미적분의 개념들은 AI가 복잡한 문제를 해결하는 데 중요한 역할을 합니다.
고등학교에서 배우는 수학이 실제로 어떻게 응용되는지 이해하는 것은 미래의 AI 전문가가 되는 첫걸음이 될 수 있습니다.
출처:
Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.
Russell, S. J., & Norvig, P. (2020). Artificial Intelligence: A Modern Approach (4th ed.). Pearson.
Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springer.
Szeliski, R. (2010). Computer Vision: Algorithms and Applications. Springer.
'교육정보' 카테고리의 다른 글
미적분 활용_경제학과 금융 분야 (0) | 2024.10.16 |
---|