강의자료/인공지능수학 22

[기초수학] 지수함수

1. 지수함수란 a를 양의 상수, x를 모든 실수 값을 취하는 변수라고 할 때 y=ax 형태로 주어지는 함수를 의미한다. 상수 a는 지수함수의 밑(base) 라고 한다. 밑의 값으로 특히 중요한 것은 자연상수 e 이다. 자연상수 e 는 다음과 같은 근삿값을 갖는다. e=2.718281828.... y=ex 역시 그래프로 나타낼 수 있으며 실변수 x의 함수로서 그래프는 항상 양수이고 왼쪽에서 오른쪽으로 증가한다. 이 때 그래프는 x축과 만나지 않지만 x축에 점점 접근해 간다. 2. 지수함수를 사용하는 이유 미분은 그래프의 기울기값으로 생각할 수 있다. 만약 시간(x축)에서 이동하는 거리(y축)을 측정한 후 특정시간에서의 기울기를 구하게 되면 그 시간을 지나는 시점의 속도를 알 수 있다. 적분은 미분의 반대..

[기초수학] 제곱근

제곱근의 개념 - 제곱을 했을때 어떤 수가 되는 값을 그 어떤수에 대한 제곱근이라고 부른다. - 제곱근을 표현할때는 기호로 √(루트) 를 사용한다. 제곱근의 정의 어떤 수 a에 대해 a= b^2 을 만족하는 b가 있다면 이러한 b를 a의 제곱근이라고 한다. 실수에서는 양수에 대한 제곱근이 반드시 대개 존재한다. 제곱근의 공식 - √a^2 = a - a * √b = a√b - b√a + c√b=(b+c)√a - √a * √b = √ab - √a ÷ √b = √a/√b = √(a/b) - √(a^2 * b) = a√b 연습문제 1) 9의 제곱근을 구하시오 (3,-3) 2) 다음 문제를 계산하시오. 단 근호 안의 숫자가 최소가 되도록 표현하시오. √18 + √2 = √(3^2*2)+√2=3√2 3√6 * 2√..

[인공지능수학] 신뢰구간(Confidence Interval)

1. 신뢰구간이란? 신뢰구간은 모수가 실제로 포함될 것으로 예측되는 범위를 의미한다. 대통령 선거때 출구조사를 통해서 신뢰수준 95% 이내에서 투표자의 몇 퍼센트가 후보자 A를 지지하고 있다는 말을 많이 듣는다. 이때 95%는 신뢰구간이며 몇 퍼센트는 A후보의 지지율이다. 신뢰구간을 사용하는 이유는 전체 표본을 수집하는데 시간과 비용이 많이 들기 때문에 표본을 구해서 모집단의 평균 범위를 추정한다. 2. 남산도서관 데이터로 알아보는 신뢰구간 2023.02.10 - [강의자료/인공지능수학] - [인공지능수학] 중심극한정리 지난 시간 남산도서관 데이터를 활용하여 중심극한 정리 를 알아 보았다. 남산 도서관 대출 건수를 모집단으로 1000개의 표본을 뽑아 계산한 표본의 평균이 표본의 갯수가 많을 수록 모집단의..

[인공지능수학] 중심극한정리

1. 중심극한정리(central limit theorem)란? 확률론과 통계학에서 중심극한정리는 동일한 확률분포를 가진 독립확률변수 n개의 평균의 분포는 n이 적당히 크다면 정규분포에 가까워진다는 정리이다. 이 의미는 다음과 같다. 모집단이 있을 때 여기서 30개의 샘플을 뽑아 표본을 만든다. 그 다음 표본의 평균을 계산한다. 이런 과정을 여러 번 반복해서 1000개의 평균을 만들어 놓는다. 그리고 이 1000개의 평균을 히스토그램으로 그리면 놀랍게도 정규분포를 따른다. 현실에서는 표본을 수집하는 일에 비용이 많이 들지만 파이썬 프로그램을 사용해 이런 과정을 간단히 묘사할 수 있다. 예를 들어 남산도서관 대출데이터를 가지고 확인을 해 보자. 혼자공부하는데이터분석 에서 제공하는 자료 ( https://bi..

[인공지능수학] 누적분포

1. 누적분포란 평균이 0이고 표준편차가 1인 정규분포를 표준정규분포라고 한다. 평균이 0이고 표준편차가 1인 z점수 공식에 대입하면 z = x 가 된다. 따라서 표준 정규분포는 z 점수를 사용해 전체 데이터가 어떻게 분포되어 있는지 나타낼 수 있다. 예를 들어 표준정규분포에서 z 점수가 1.0 이내에 위치한 샘플은 전체의 약 68%에 해당한다. z점수 2.0 이내에 위치한 샘플은 95%에 해당한다. 여기서 x축은 샘플값 또는 z점수, y축은 샘플의 등장 빈도 또는 밀도가 된다. 그럼 z 점수 1.5 이내에 있는 샘플의 비율은 얼마나 될까? 2. 누적분포 구하기 누적분포는 주어진 확률이 특정 값보다 작거나 같은 확률을 나타내는 값이다. 가령 표준정규분포에서 평균 0 까지 누적분포는 정확히 50%가 될것이..

[인공지능수학] 표준점수

1. 표준점수란? 데이터가 정규분포를 따른다고 가정하고 각 값이 평균에서 얼마나 떨어져 있는지 표준편차를 사용해 변환한 점수를 표준점수(standard score) 또는 z점수 라고 한다. 예를 들면 다음과 같다. 출생한 아기의 몸무게와 키에 대한 데이터가 있다고 가정해 보자.몸무게와 키가 평균으로부터 얼마만큼 떨어져 있는지 나타내려면 몸무게는 1kg, 키는 5cm 와 같이 다른 단위를 써야 한다.게다가 이런 수치만 보아서는 평균으로부터 몸무게가 더 멀리 떨여져 있는지, 키가 더 멀리 떨어져 있는지 알기 어렵다. 그래서 z점수라는 값을 사용한다. 2. 표준점수(z점수) 구하기 z점수는 평균까지의 거리를 표준편차로 나눈 값이다. 식은 다음과 같다. z점수 = (x - 모집단평균)/모집단의 표준편차 와 같이..

[인공지능수학] 호도법/도수법 실습하기

https://wondangcom.tistory.com/2135 에서 도수법과 호도법에 대해 살펴 보았습니다. 이번 시간에는 도수법과 호도법을 파이썬으로 변환하는 방법에 대해 살펴 보도록 하겠습니다. 1. 도수법 -> 호도법 도수법 60도를 호도법인 deg로 나타내는 방법을 살펴 보도록 하겠습니다. import numpy as np import math deg1 = 60 * math.pi / 180 print(deg1) deg2 = np.deg2rad(60) print(deg2) deg3 = math.radians(60) print(deg3) deg1 은 1도 = pi/180 이므로 직접 연산을 한 값 deg2은 numpy 에서 제공하는 deg2rad 메서드로 연산을 한 값 deg3은 math 함수에서 ..

[인공지능수학] 등차수열의 합 실습하기

등차수열이란? 앞과 뒤의 두 항의 차이가 일정한 수열을 말합니다. 11,14,17... 은 두 항의 차이(공차)가 3으로 일정한 등차 수열입니다. 이러한 등차 수열에서 n번째 항의 값 = 초항 + (n-1) * (공차) 예를 들어 1 부터 시작하는 공차 1인 수열이라면 1,2,3,... 과 같이 진행 되는데 10번째 항의 값을 구하려면 초항 1의 9번째 뒤의 값이므로 (10-1)번째 * 공차(1) 을 더해 주면 10이라는 수를 구할 수 있습니다. 등차수열의 합은 (초항 + n번째 항의값) * n(개) / 2로 확인을 할 수 있는데 이 공식은 가우스가 초등학교 3학년때 1부터 100까지의 수를 더하라는 선생님의 문제에 1과 100을 짝짓기 해서 50개를 만들어서 곱셈으로 풀었다는 그 유명한 공식입니다. 오..

[인공지능수학] 함수의 개념 실습하기

함수의 개념 이해하기 - https://wondangcom.tistory.com/2123 [인공지능수학] 함수의 개념 함수의 개념 집합 A,B에 대해 집합 A에서 B로 가는 관계가 성립 할 때, 집합 A의 원소 a에 대해 집합 B의 원소 b 하나가 대응 되는 관계, 즉 입력값(정의역)에 의해 하나의 결과값(치역)이 존재하는 wondangcom.com I. 1차 함수 fx = 3x + 10 형태의 그래프 실습 1. x의 값을 1~10까지의 데이터 생성하기 import numpy as np import matplotlib.pyplot as plt x = np.linspace(1,10,10) print(x) numpy 모듈의 linspace() 함수는 1차원의 배열을 만들어 주는 함수이다. Linearly S..

[인공지능 수학] 주성분 분석

1. 주성분 분석(principal component analysis)란? 주성분 분석(PCA)은 고차원의 데이터를 저차원의 데이터로 환원시키는 기법을 말합니다. 이 때 서로 연관 가능성이 있는 고차원 공간의 표본들을 선형 연관성이 없는 저차원 공간(주성분)의 표본으로 변환하기 위해 직교 변환을 사용합니다. 이렇게 설명 했을 때 이해하기가 살짝 어려운데요~ 주성분 분석이 어떤 경우에 사용되는지 먼저 살펴 보면 이해하기가 쉽습니다. 인공지능에서는 데이터의 차원이 엄청 많은데요~ 그러다 보니 계산 속도도 느려지고 저장할 수 있는 공간도 어마어마 해 집니다. 가령 3차원의 데이터를 살펴 보면 4 * 4 * 4 형태의 데이터가 있다면 저장할 수 있는 공간은 64개의 메모리 공간이 필요합니다. 이 데이터를 손실 ..