강의자료 245

[캐글(Kaggle) 따라하기]01.왜 캐글인가?

1. 캐글이란? 캐글은 데이터과학 및 머신러닝 경진대회를 주최하는 온라인 커뮤니티로 전 세계 데이터 과학자를 위한 놀이터이다. 캐글에는 방대한 데이터, 유능한 데이터 과학자, 훌륭한 코드,좋은 문화가 있어 데이터 과학 역량을 쌓는데 최적의 플랫폼이다. 2. 캐글을 해야만 하는 이유? 코딩인터뷰에 대비하기 위해 다양한 알고리즘 문제사이트(백준,알고스팟,프로그래머스등)를 활용합니다. 세상이 바뀌어 앞으로의 기술은 알고리즘만으로 해결하기 어려운 문제들에 도전하고 있습니다. 바로 데이터과학과 머신러닝이 대표적입니다. 이 분야에서는 '데이터' 가 핵심입니다. 데이터 없이는 유의미한 문제를 제시 할 수 조차 없습니다. 그리고 양질의 데이터는 개인이나 작은 단체에서는 쉽사리 만들어 내기도 어렵습니다. 이러한 환경에서..

강의자료/머신러닝 2022.09.23 (5)

[알고리즘 수학] 가짜동전과 진짜 동전 구별하기

가끔 이러한 뉴스를 확인 할 수 있는데요~ 오늘은 가짜동전 진짜 동전에 대한 퀴즈를 풀어 보도록 하겠습니다. 원당이 친구가 원당이에게 동전 100개씩 들어 있는 동전꾸러미 10개를 들고 와서는 원당이에게 다음과 같이 물어 보았습니다. "이 동전은 모양과 크기가 모두 같은데 한 꾸러미 안에 있는 동전은 가짜야~" "진짜 동전의 무게는 10g 이고 가짜의 무게는 9g 인데 이것을 한번에 판단하는 방법이 있을까?" 원당이에게는 동전의 무게를 정확하게 잴 수 있는 저울이 있습니다. 이 저울을 이용하여 한번에 진짜동전과 가짜 동전을 구별해 낼 수 있을 까요? 풀이 더보기 한번에 찾을 수 있습니다. 10개 꾸러미에 1 부터 10까지 번호를 먼저 매겨 놓습니다. 그리고 나서 1번 꾸러미에서 동전 1개,2번 꾸러미에서..

[딥러닝실습] 이미지 분류(CNN) II-Flatten을 이용한 딥러닝 학습

목표 이미지셋 데이터에서 딥러닝 모델의 특징을 추출하는 방법에 대해 이해 합니다. 실습하기 지난시간에 CNN의 구조를 살펴 보았습니다. CNN의 레이어는 크게 두가지 부분으로 나뉩니다. 1. Convolution/Pooling : 메커니즘은 이미지를 형상으로 분할하고 분석 2. FC(Fully Connected Layer) : 이미지를 분류/설명하는 데 적합하게 예측 위의 이미지는 32*32의 이미지 데이터를 LeNet 모델로 처리하는 이미지 입니다. C1 레이어 : 32*32 이미지를 6개의 5*5 필터와 컨볼루션 연산을 이용해 6장의 28*28 특징맵을 만드는 과정입니다. Convolution 연산은 다음과 같은 과정을 거쳐서 특징점을 만들게 됩니다. 4*4 이미지를 사이즈 3*3 필터를 사용하면 특..

강의자료/머신러닝 2022.09.16 (8)

[딥러닝실습] 이미지 분류(CNN) II-Conv2D을 이용한 딥러닝 학습

목표 컨볼루션에 대한 이해와 컨볼루션 레이어의 사용법을 이해합니다. 실습하기 지난시간에 CNN의 구조를 살펴 보았습니다. CNN의 레이어는 크게 두가지 부분으로 나뉘는 부분에 대해 살펴 보았습니다. 1. Convolution/Pooling : 메커니즘은 이미지를 형상으로 분할하고 분석 2. FC(Fully Connected Layer) : 이미지를 분류/설명하는 데 적합하게 예측 지난시간에는 Fully Connected Layer 부분을 Flatten을 이용하여 2차원 배열의 데이터를 1차원 배열의 데이터로 변환하여 학습하는 모델을 만들어 보았습니다. 오늘은 컨볼루션 부분에 대해 살펴 보겠습니다. 먼저 실습하기 전에 컨볼루션에 대한 부분을 살펴 보겠습니다. 컨볼루션이란 컨볼루션(Convolution)은 ..

강의자료/머신러닝 2022.09.01 (7)

[알고리즘 수학]강건너기 문제

어떤 사람이 늑대 한마리, 염소 한마리, 양배추 한통을 가지고 강둑에 서 있다. 이 셋을 모두 배로 반대편으로 옮겨야 한다. 하지만 배에는 이 사람 외에는 하나만 실을 수 있다. 그 가 없으면 늑대는 염소를 먹어 버리고 염소는 양배추를 먹어 버린다. 여기서 퀴즈 늑대가 염소를 잡아먹지 못하고 또 염소가 양배추를 먹지 못하게 하면서 모두를 건너편 강가로 데려 갈 수 있을까? 힌트 사소한 예외 하나를 빼면 이 퀴즈는 각 상황에서 옮길 수 있는 유일한 것을 열거하는 방식을 풀 수 있다. 정답 더보기 풀이1) 1. 염소를 데리고 강을 건넌다.(염소/늑대,양배추) 2. 염소를 내려 놓고 다시 건너와서 늑대를 데리고 강을 건넌다. 3. 늑대를 내려 놓고 염소를 데리고 다시 건너온다.(늑대/염소,양배추) 4. 양배추..

[딥러닝실습] 이미지 분류(CNN) I-이미지 데이터 이해하기

CNN이란 CNN 은 Convolution Neural Network의 약자로 이미지를 인식하는 분류기입니다. CNN의 구조는 다음과 같습니다. 위의 이미지는 32*32의 이미지 데이터를 LeNet 모델로 처리하는 이미지입니다. 1) C1 레이어 : 32*32 이미지를 6개의 5*5 필터와 컨볼루션 연산을 이용해 6장의 28*28 특징맵을 만듭니다. 2) S2 레이어 : 6장의 28 * 28 특성 맵에 대해 서브샘플링을 진행한다. 결과적으로 28 * 28 사이즈의 특성맵이 14*14 사이즈의 특성맵으로 축소된다. 2*2 필터를 stride2로 설정해서 서브샘플링해주기 때문이다. 사용하는 서브샘플링 방법은 평균풀링(average pooling) 이다. 3) C3 레이어 : 6장의 14*14 특성맵에 6개의..

강의자료/머신러닝 2022.08.19 (5)

[아두이노]3.아두이노 디지털 핀 사용하기

1. 아두이노 디지털 신호 입출력 아두이노 우노 보드는 0번부터 13번까지 총 14개의 디지털 핀을 통해 디지털 신호를 출력하거나 입력 받을 수 있습니다. 여기서 디지털 신호란 0(LOW) 또는 1(HIGH) 두가지 신호로 구분됩니다. 2. 아두이노로 LED제어하기 아두이노로 디지털핀을 활용하여 LED를 제어하는 방법을 실습해 보도록 하겠습니다. 1. 회로연결 LED의 짧은 핀은 GND 에 연결 하고 8번 디지털 핀을 + 에 연결하는데 중간에 저항값 220옴 짜리를 하나 추가 하자. 여기서 저항을 세로의 형태를 가로로 눕히는 방법은 R을 누르면 회전을 한다. 2. 다음과 같이 코딩을 하자. // C++ code // void setup() { pinMode(8, OUTPUT); } void loop() ..

[딥러닝실습] pandas와 tensorflow를 이용한 보스턴 집값 예측

오늘은 딥러닝 실습시 가장 많이 사용하는 사이킷런에서 제공하는 보스턴 집값을 이용하여 예측하는 모델을 만들어 보도록 하겠습니다. 실습과정 지도학습의 실습과정은 다음과 같습니다. 1. 과거의 데이터를 준비합니다.(과거의 데이터에서 원인과 결과 즉 독립변수와 종속변수를 찾아 냅니다.) 2. 모델의 구조를 만듭니다. (레모네이드 판매량이 온도에 따라 달라지는데 이때 온도를 독립변수, 판매량을 종속변수로 하는 모델을 만들어 봅니다.) 3. 데이터로 모델을 학습합니다. 4. 모델을 이용합니다. 실습 도구 https://colab.research.google.com/ 실습은 코랩을 이용해서 진행하겠습니다. 과거 데이터 준비 #보스턴 주택 데이터셋 from sklearn import datasets 보스턴 = dat..

강의자료/머신러닝 2022.08.12 (11)

[인공지능수학] 표준편차

표준편차를 알기 전에 평균,기댓값,분산 의 의미를 먼저 이해 합니다. 1. 기댓값 기댓값(expected value)는 '나올 것이라고 예상하는 값' 입니다. x가 확률변수이고 P(x)인 사건이 벌어질 때, 예상할 수 있는 결과값이 기댓값입니다. 이것은 어떤 확률적 사건에 대한 평균의 의미로 생각할 수 있습니다. 이 것을 공식으로 다음과 같이 표현 합니다. 예를 들어 1~6까지 있는 주사위를 던졌을 때 나오는 기댓값은 다음과 같습니다. 1이 나올 확률 1/6 2가 나올 확률 1/6 3이 나올 확률 1/6 4가 나올 확률 1/6 5가 나올 확률 1/6 6이 나올 확률 1/6 따라서 E[x]=1*1/6 + 2 * 1/6 + 3*1/6 + 4*1/6 + 5*1/6 + 6 *1/6 = 3.5 가 됩니다. 2. ..

[딥러닝실습] 히든레이어 생성 실습

2021.12.03 - [강의실/머신러닝] - 01-5. 퍼셉트론이란? 01-5. 퍼셉트론이란? 인공지능의 역사를 보면 1950년대 퍼셉트론을 제시 후 이 이론을 바탕으로 1960년대 제1전성기를 맞이하게 되는데요~ 이 퍼셉트론은 향후 다층 퍼셉트론으로 다시 돌아 오면서 제2전성기를 맞이 wondangcom.com 퍼셉트론에서 단층퍼셉트론이 진화를 해서 다층퍼셉트론이 나오게 되는데요~ 여러개의 은닉층을 두어 다층퍼셉트론을 만들었다고 확인을 했습니다. 오늘은 여러개의 은닉층을 만드는 방법에 대해 살펴 보도록 하겠습니다. 보스턴 집값을 예측하는 모델의 구성은 다음과 같은 형태를 가지고 있었습니다. 13개의 독립변수를 가지고 하나의 종속변수를 만드는 단층레이어 모델로 실습을 진행했습니다. 이것을 위와 같은 다..

강의자료/머신러닝 2022.08.05 (13)