강의자료/머신러닝 44

[머신러닝활용] dlib 라이브러리를 이용한 얼굴 인식

1. 실습환경 Tool : Pycharm 웹캠 OpenCV,dlib 설치 얼굴 특징점 추출 모듈 : https://osdn.net/projects/sfnet_dclib/downloads/dlib/v18.10/shape_predictor_68_face_landmarks.dat.bz2/ Downloading File /dlib/v18.10/shape_predictor_68_face_landmarks.dat.bz2 - dlib C++ Library - OSDN Free download page for Project dlib C++ Library's shape_predictor_68_face_landmarks.dat.bz2.Dlib is a C++ toolkit containing machine learning..

강의자료/머신러닝 2023.01.17 (6)

[머신러닝활용] OpenCV 사용법 알아보기

머신러닝 모델을 만들었다면 그것을 어떤식으로 활용을 하는지 무척 궁금했었는데요. 머신러닝 활용 편에서는 기존에 만들어진 모델들을 활용해서 어떻게 사용되는지 살펴 보도록 하겠습니다. 이미지 처리 분야에서 가장 많이 사용되는 OpenCV에 대해서 살펴 보도록 하겠습니다. 1. OpenCV란 OpenCV(Open source Computer Vision) 는 실시간 컴퓨터 비젼을 처리하는 목적으로 만들어진 라이브러리이다. 설치 방법 pip install opencv-python 2.이미지 파일 읽기 cv2.imread 함수로 이미지 파일을 읽는다. 이미지 파일은 Numpy array 형태의 값으로 입력이 되고 이 숫자가 해당 위치에서의 색을 의미한다. 사용법 cv2.imread(fileName, flag) f..

강의자료/머신러닝 2023.01.10 (11)

[캐글(Kaggle) 따라하기]06-2.랜덤 포레스트(RandomForest)

https://wondangcom.tistory.com/2354 타이타닉 문제를 해결 하면서 에서 랜덤 포레스트로 훈련을 해 보았는데요~ 오늘은 랜덤 포레스트가 무엇인지 확인을 해 보겠습니다. 1. 랜덤포레스트(Random Forest)란? 랜덤포레스트는 훈련을 통해 구성해 놓은 다수의 나무들로 부터 분류 결과를 취합에서 결론을 얻는 일종의 인기투표와 같은 것이라고 생각하면 좋을 것 같습니다. 랜덤 포레스트는앙상블 학습의 대표 주자 중 하나로 안정적인 성능 덕분에 널리 사용되고 있습니다. 랜덤 포레스트는 결정트리를 랜덤하게 만들어 결정트리의 숲을 만듭니다. 그리고 각 결정트리의 예측을 사용해 최종예측을 만듭니다. 먼저 랜덤포레스트는 각 트리를 훈련하기 우한 데이터를 랜덤하게 만드는데 이 데이터를 만드는 ..

강의자료/머신러닝 2022.12.29 (12)

[캐글(Kaggle) 따라하기]06-1.의사결정 트리

https://wondangcom.tistory.com/2354 타이타닉 문제를 해결 하면서 에서 의사결정 트리로 훈련을 해 보았는데요~ 오늘은 의사결정트리가 무엇인지 확인을 해 보겠습니다. 1. 의사결정트리(Decision Tree)란? 의사결정트리는 일련의 분류 규칙을 통해 데이터를 분류,회귀하는 지도학습 모델 중 하나이다. 결과 모델이 Tree 구조를 가지고 있기 때문에 Decision Tree라는 이름을 가진다. 모델의 형태는 다음과 같다. 이러한 결정트리 모델은 마치 스무고개 문제와 같습니다. 즉 남자인가? 라는 질문에 아니오 라면 생존, 예라면 나이가 10살보다 작은가? 라는 질문에서 예라면 생존, 아니라면 사망 과 같이 한 단계 한단계 질문에 따라 데이터를 구분하는 모델을 의사결정트리 모델이..

강의자료/머신러닝 2022.12.21 (6)

[캐글(Kaggle) 따라하기]05-3. 데이터 전처리 실습하기

이전시간(https://wondangcom.tistory.com/2357)에 최근접 이웃 알고리즘을 실습을 해 보았습니다. 그런데 다음의 데이터를 예측을 해 보면 어떤 결과를 나타낼까요? 길이 25, 무게 150 그램을 판단 해 보면 도미라고 나와야 할 것 같은데 빙어라고 나오는 것을 확인 할 수 있네요. 그래프를 그려 보면 다음의 위치에 있습니다. 왜 이런 결과가 생겼을까요? 이것은 단위가 틀린 것이 문제가 됩니다. 무게를 살펴 보면 도미의 가장 가벼운 무게는 242부터 시작하고 빙어의 무게는 19.9 까지의 무게 인것을 알 수 있습니다. 이때 무게의 거리로 다섯개를 찾아 보면 도미 한마리와 빙어 4마리가 선택 됩니다. 따라서 이러한 단위가 틀린 데이터를 같은 기준으로 맞추어야 합니다. 1. 기준을 맞..

강의자료/머신러닝 2022.12.14 (7)

[캐글(Kaggle) 따라하기]05-2.KNN(K-최근접 이웃) 알고리즘2 - 실습하기

지난시간(https://wondangcom.tistory.com/2356) 에 이어서 KNN 실습을 진행 합니다. 진행하기 전 먼저 지도학습과 비지도 학습에 대한 개념을 이해 하겠습니다. 1. 지도학습과 비지도 학습 지도학습이란? 지도학습에서는 입력(input)과 타깃(target)을 훈련데이터(training data)로 사용하는 학습 방법을 의미한다. 앞에서 살펴본 입력데이터는 길이와 무게를 특성(feature)로 사용하였고 빙어/도미 의 타깃을 주어 해당 특성이 어떤 데이터인지를 살펴 보았다. 비지도학습이란? 비지도 학습은 타깃이 주어지지 않고 입력데이터만 으로 훈련을 하는 학습 방법을 의미한다. 2. 훈련세트와 테스트 세트 다음으로 머신러닝을 훈련 하기 위해서는 훈련세트와 테스트 세트가 필요 합니..

강의자료/머신러닝 2022.12.09 (7)

[캐글(Kaggle) 따라하기]05-1.KNN(K-최근접 이웃) 알고리즘1- 데이터 준비

지난시간(https://wondangcom.tistory.com/2354) 타이타닉 문제를 해결하면서 KNN,의사결정트리,랜덤 포레스트,SVM 의 알고리즘의 정확도를 비교해 보았는데요~ 이번시간에는 KNN 알고리즘에 대해 다루어 보겠습니다. 1. KNN(K-최근접 이웃) 알고리즘이란? 어떤 데이터에 대한 답을 구할 때 주위의 다른 데이터를 보고 다수를 차지하는 것을 정답으로 사용하는 알고리즘입니다. 2. 실습하기 - 실습환경 : 코랩( https://colab.research.google.com/?hl=ko ) - 내용 : 빙어 데이터와 도미 데이터를 분류하는 이진 분류 1. 데이터 준비 먼저 도미와 빙어 데이터가 포함된 데이터를 구합니다. 캐글에는 많은 데이터가 제공되고 있습니다. 캐글에서 제공하는 물..

강의자료/머신러닝 2022.11.22 (9)

[캐글(Kaggle) 따라하기]04. 타이타닉 문제 해결하기

학습목표 타이타닉호의 침몰은 역사상 가장 악명 높은 난파선 중 하나입니다. 이 챌린지에서는 어떤 종류의 사람들이 생존할 가능성이 더 높았습니까? 라는 질문에 답하는 예측 모델을 구축하도록 요청합니다. 캐글에서 타이타닉 문제를 해결해 봅니다. 경진대회 참여 1. https://www.kaggle.com/c/titanic 에 접속합니다. 2. Data 카테고리를 클릭하면 다음과 같이 훈련세트와 테스트 세트가 존재합니다. 훈련세트의 필드명의 조건을 확인 합니다. 3. code 를 클릭하여 새로운 노트를 만듭니다. Data 클릭하여 다음과 같이 3개의 파일을 확인 합니다. 4. 데이터 살펴 보기 import pandas as pd train = pd.read_csv('/kaggle/input/titanic/tr..

강의자료/머신러닝 2022.11.15 (6)

[캐글(Kaggle) 따라하기]03.데이터 시각화를 위한 Seaborn

학습목표 머신러닝은 데이터와의 씨름이다. 데이터를 어떻게 이해하느냐에 따라 모델링 전략이 달라지고 예측 성능에 결정적인 영향을 준다. 주로 탐색적 데이터 분석 과정에서 수행하는 데이터 시각화는 평면적인 데이터에서 주요한 특성을 드러내는 가장 효과적인 수단이다. 따라서 시각화 기법들을 잘 이해하고 적절히 활용하는 것이 중요하다. 다양한 시각화 기법의 개념, 효과 , 구현 방법 등을 알아 보자. Seaborn 라이브러리란? Seaborn 라이브러리는 데이터 시각화를 손쉽게 도와주는 matplotlib 기반의 Python 데이터 시각화 라이브러리이다. Seaborn 라이브러리에 대한 정보는 (https://seaborn.pydata.org/) 에서 참고 하면 된다. Seaborn 라이브러리에서 제공하는 함수는..

강의자료/머신러닝 2022.10.25 (5)

[캐글(Kaggle) 따라하기]02.타이타닉으로 캐글 경진대회 참여 방법 살펴 보기

학습목표 캐글 가입부터 결과 제출까지 전체 프로세스를 배우자. 학습순서 캐글가입 -> 경진대회 참여 -> 주피터 노트북 설정 -> 결과 제출하기 -> 컨트리뷰터 되기 -> 예제코드 캐글 노트북 복사하기 1. 캐글 가입 kaggle.com 에 접속 홈페이지 우측 상단의 Register 클릭하여 가입 구글 계정으로 가입 가능 2. 경진대회 참여 타이타닉 경진대회에 참여해 보자. 이 대회는 타이타닉호를 탄 승객들의 이름,성별,나이,지불한 운임,가족수 등 여러 정보를 주고 각 승객이 살았는지 죽었는지 예측하는 경진대회로 대회라기 보다는 튜토리얼 성격이 강하다. 1. Competitions 메뉴 클릭 2. 검색창에 Titanic 이라고 검색한 뒤 Titanic:Machine Learning from Disaste..

강의자료/머신러닝 2022.09.30 (9)