2025년, 코딩은 선택이 아닌 필수!

2025년 모든 학교에서 코딩이 시작 됩니다. 먼저 준비하는 사람만이 기술을 선도해 갑니다~

강의자료/인공지능수학 26

[인공지능수학] 시그모이드 함수

시그모이드 함수를 알아보기 전에 선형 회귀에 대해 알아 보자. 1. 선형회귀 선형 회귀는 1차 함수로 표현할 수 있다. y=ax+b 여기서 a는 기울기(slope)이고 b는 절편(intercepter)이다. 딥러닝 분야에서는 기울기 a를 가중치를 의미하는 w로 표현하고 그리고 결과 y는 ˆy(y햇)으로 표기한다. 즉 선형 회귀 y=ax + b를 딥러닝 분야에서는 ˆy = wx + b와 같이 표현한다. 이러한 결과를 찾기 위해 전통적인 프로그램에서는 사람이 이러한 w와 b 의 값을 찾아 x를 입력받아 ˆy 을 출력하는 문제라면 딥러닝에서는 데이터를 입력 받아 w와 b 값을 찾아내는 모델을 만드는 것이 목적이다. 다음으로 이러한 선형회귀를 확장하여 분류모델(classification)을 만드는 과정을 이해해..

[인공지능수학]1차 함수로 이해하는 선형 회귀

1. 1차 함수로 이해하는 선형 회귀 선형 회귀는 1차 함수로 표현 할 수 있다. y=ax+b 위 1차 함수의 기울기(slope)는 a이고 절편(intercepter)은 b이다. 1. 머신러닝에서 선형회귀는 기울기와 절편을 찾아 준다. 선형 회귀는 기울기와 절편을 찾아주는 알고리즘이다. 다음과 같은 문제를 살펴 보자. x가 3일때 y=25 x가 4일때 y=32 x가 5일때 y=39 라면 기울기와 절편의 값으로 적절한 것은 무엇인가. 여기서 x가 1씩 증가 할 때 y의 값은 7씩 증가하는 것을 알 수 있다. 따라서 y = 7x + b 여기서 x가 3일 때 y= 25 라고 했으니 25 = 7*3 + b 이므로 b는 4 인 것을 알 수 있다. 따라서 기울기는 7 절편은 4 인것을 알 수 있다. 이러한 문제를 ..

[기초수학]신경망에서 많이 사용하는 시그마

Σ (시그마)기호의 의미 수열의 부분합을 Σ 로 나타내며 Σ는 합을 의미하는 영어단어 'sum'의 앞글자 s에서 유래한 것이라고 한다. 수열 an의 합을 시그마 기호로 나타내면 다음과 같으며 '1항부터 n항까지 주열 an의 합계' 라는 의미이다. $$\sum_{k=1}^na_{k}=a_{1}+a_{2}+a_{3}+...+a_{n}$$ 시그마 기호에 있는 문자 k는 항 숫자를 의미한다. 수학에서는 항 숫자를 의미하는 알파벳으로 i,j,k,l,m,n을 자주 이용하며 실제 사용은 다음과 같이 사용된다. $$ \sum_{n=1}^{5}a_{n}=a_{1}+a_{2}+a_{3}+a_{4}+a_{5} $$ $$ \sum_{i=1}^{5}i^{2}=1^{1}+2^{2}+3^{2}+4^{2}+5^{2} $$ $$ \s..

[기초수학] 수열과 점화식

1. 수열이란 수열은 수를 나열한 것을 의미한다. 즉 1,2,3,4... 와 같이 수를 나열하고 첫번째항은 1항,두번째 항은 2항,.... n번째 항은 n항이라고 한다. 바로 위의 수열에서 1항은 1,2항은 2 의 값을 갖는다. 신경망의 수열은 유한개 항 수를 갖는 수열이다. 이렇게 유한개 항 수를 갖는 수열을 유한수열이라고 하며 마지막 항은 말항(final term) 또는 끝항 이라고 한다. 만약 1,4,7,10 과 같은 수열이 있다면 말항은 10이다. 2. 수열의 일반항 일반항이란 수열에서 n번째 항을 의미한다. n은 자연수로 수열의 모든 항을 n에 대한 식으로 나타낸 것이다. 따라서 일반항은 n에 대한 함수의 성격을 가진다. 예를 들어 2,4,6,8... 과 같은 수열의 n번째 항은 2*n의 값을 ..

[기초수학] 지수함수

1. 지수함수란 a를 양의 상수, x를 모든 실수 값을 취하는 변수라고 할 때 y=ax 형태로 주어지는 함수를 의미한다. 상수 a는 지수함수의 밑(base) 라고 한다. 밑의 값으로 특히 중요한 것은 자연상수 e 이다. 자연상수 e 는 다음과 같은 근삿값을 갖는다. e=2.718281828.... y=ex 역시 그래프로 나타낼 수 있으며 실변수 x의 함수로서 그래프는 항상 양수이고 왼쪽에서 오른쪽으로 증가한다. 이 때 그래프는 x축과 만나지 않지만 x축에 점점 접근해 간다. 2. 지수함수를 사용하는 이유 미분은 그래프의 기울기값으로 생각할 수 있다. 만약 시간(x축)에서 이동하는 거리(y축)을 측정한 후 특정시간에서의 기울기를 구하게 되면 그 시간을 지나는 시점의 속도를 알 수 있다. 적분은 미분의 반대..

[기초수학] 제곱근

제곱근의 개념 - 제곱을 했을때 어떤 수가 되는 값을 그 어떤수에 대한 제곱근이라고 부른다. - 제곱근을 표현할때는 기호로 √(루트) 를 사용한다. 제곱근의 정의 어떤 수 a에 대해 a= b^2 을 만족하는 b가 있다면 이러한 b를 a의 제곱근이라고 한다. 실수에서는 양수에 대한 제곱근이 반드시 대개 존재한다. 제곱근의 공식 - √a^2 = a - a * √b = a√b - b√a + c√b=(b+c)√a - √a * √b = √ab - √a ÷ √b = √a/√b = √(a/b) - √(a^2 * b) = a√b 연습문제 1) 9의 제곱근을 구하시오 (3,-3) 2) 다음 문제를 계산하시오. 단 근호 안의 숫자가 최소가 되도록 표현하시오. √18 + √2 = √(3^2*2)+√2=3√2 3√6 * 2√..

[인공지능수학] 신뢰구간(Confidence Interval)

1. 신뢰구간이란? 신뢰구간은 모수가 실제로 포함될 것으로 예측되는 범위를 의미한다. 대통령 선거때 출구조사를 통해서 신뢰수준 95% 이내에서 투표자의 몇 퍼센트가 후보자 A를 지지하고 있다는 말을 많이 듣는다. 이때 95%는 신뢰구간이며 몇 퍼센트는 A후보의 지지율이다. 신뢰구간을 사용하는 이유는 전체 표본을 수집하는데 시간과 비용이 많이 들기 때문에 표본을 구해서 모집단의 평균 범위를 추정한다. 2. 남산도서관 데이터로 알아보는 신뢰구간 2023.02.10 - [강의자료/인공지능수학] - [인공지능수학] 중심극한정리 지난 시간 남산도서관 데이터를 활용하여 중심극한 정리 를 알아 보았다. 남산 도서관 대출 건수를 모집단으로 1000개의 표본을 뽑아 계산한 표본의 평균이 표본의 갯수가 많을 수록 모집단의..

[인공지능수학] 중심극한정리

1. 중심극한정리(central limit theorem)란? 확률론과 통계학에서 중심극한정리는 동일한 확률분포를 가진 독립확률변수 n개의 평균의 분포는 n이 적당히 크다면 정규분포에 가까워진다는 정리이다. 이 의미는 다음과 같다. 모집단이 있을 때 여기서 30개의 샘플을 뽑아 표본을 만든다. 그 다음 표본의 평균을 계산한다. 이런 과정을 여러 번 반복해서 1000개의 평균을 만들어 놓는다. 그리고 이 1000개의 평균을 히스토그램으로 그리면 놀랍게도 정규분포를 따른다. 현실에서는 표본을 수집하는 일에 비용이 많이 들지만 파이썬 프로그램을 사용해 이런 과정을 간단히 묘사할 수 있다. 예를 들어 남산도서관 대출데이터를 가지고 확인을 해 보자. 혼자공부하는데이터분석 에서 제공하는 자료 ( https://bi..

[인공지능수학] 누적분포

1. 누적분포란 평균이 0이고 표준편차가 1인 정규분포를 표준정규분포라고 한다. 평균이 0이고 표준편차가 1인 z점수 공식에 대입하면 z = x 가 된다. 따라서 표준 정규분포는 z 점수를 사용해 전체 데이터가 어떻게 분포되어 있는지 나타낼 수 있다. 예를 들어 표준정규분포에서 z 점수가 1.0 이내에 위치한 샘플은 전체의 약 68%에 해당한다. z점수 2.0 이내에 위치한 샘플은 95%에 해당한다. 여기서 x축은 샘플값 또는 z점수, y축은 샘플의 등장 빈도 또는 밀도가 된다. 그럼 z 점수 1.5 이내에 있는 샘플의 비율은 얼마나 될까? 2. 누적분포 구하기 누적분포는 주어진 확률이 특정 값보다 작거나 같은 확률을 나타내는 값이다. 가령 표준정규분포에서 평균 0 까지 누적분포는 정확히 50%가 될것이..

[인공지능수학] 표준점수

1. 표준점수란? 데이터가 정규분포를 따른다고 가정하고 각 값이 평균에서 얼마나 떨어져 있는지 표준편차를 사용해 변환한 점수를 표준점수(standard score) 또는 z점수 라고 한다. 예를 들면 다음과 같다. 출생한 아기의 몸무게와 키에 대한 데이터가 있다고 가정해 보자.몸무게와 키가 평균으로부터 얼마만큼 떨어져 있는지 나타내려면 몸무게는 1kg, 키는 5cm 와 같이 다른 단위를 써야 한다.게다가 이런 수치만 보아서는 평균으로부터 몸무게가 더 멀리 떨여져 있는지, 키가 더 멀리 떨어져 있는지 알기 어렵다. 그래서 z점수라는 값을 사용한다. 2. 표준점수(z점수) 구하기 z점수는 평균까지의 거리를 표준편차로 나눈 값이다. 식은 다음과 같다. z점수 = (x - 모집단평균)/모집단의 표준편차 와 같이..