2025년, 코딩은 선택이 아닌 필수!

2025년 모든 학교에서 코딩이 시작 됩니다. 먼저 준비하는 사람만이 기술을 선도해 갑니다~

강의자료/머신러닝 22

1.5 머신러닝의 모델 구분

머신러닝 전체 목차 - https://wondangcom.tistory.com/2769 목차 목표 회귀모델과 분류모델의 가장 큰 차이점인 예측대상이 연속형 숫자와 이산형 클래스 개념인 것을 정확히 이해하자. 종속 변수를 예측 할 때 회귀모델로 사용해야 할 지 분류모델로 선택해야 할 지 를 선택할 수 있는 힘을 키운다. 1.회귀모델이란? 회귀모델은 간단하게 말해서 뭔가를 예측하는 수학적인 방법이다. 예를 들어, 친구들이 자주 먹는 사탕의 양과 날씨를 가지고, 내일 사탕을 몇 개 더 사야 할지 예측한다고 생각해보자. 이런 예측을 도와주는 것이 바로 회귀모델이다. 이러한 회귀 모델은 데이터의 특성(feature)을 기반으로 하여 종속 변수(dependent variable)와 독립 변수(independent ..

1.4 머신러닝에서 사용되는 용어

목표 머신러닝에서 사용하는 기본 용어를 이해한다. 머신러닝 전체 목차 - https://wondangcom.tistory.com/2769 목차 머신러닝의 기본 용어 데이터: 머신러닝의 핵심은 데이터입니다. 데이터는 학습에 사용되는 정보를 나타냅니다. 이 데이터는 입력 또는 특성(feature)이라고도 불리는 여러 변수들로 구성되어 있습니다. 특성(Feature): 데이터의 특징이나 속성을 나타내는 변수를 말합니다. 예를 들어, 고객 데이터에서 나이, 성별, 소득 등은 특성이 될 수 있습니다. 머신러닝 모델은 이러한 특성들을 분석하여 패턴을 학습하고 예측합니다. 레이블(Label) 또는 타겟(Target): 지도 학습(Supervised Learning)에서는 각 데이터 포인트에 대해 예측하고자 하는 값을..

1.3 머신러닝 시스템의 종류

목표 머신러닝 시스템의 종류를 살펴 보고 지도학습과 비지도학습의 차이에 대해 확인하자. 머신러닝 전체 목차 - https://wondangcom.tistory.com/2769 목차 1. 훈련 지도 방식에 의한 분류 1.1 지도 학습 지도 학습은 입력 데이터와 해당 데이터에 대한 정답(레이블)이 함께 주어지는 학습 방식. 주로 분류(Classification)와 회귀(Regression) 문제에 사용된다. 대표적으로 의료 진단, 스팸 메일 필터링 등이 있다. 1.2 비지도 학습 비지도 학습은 정답이 주어지지 않은 데이터를 사용하여 학습하는 방식. 데이터의 패턴이나 구조를 찾는 데 사용된다. 대표적으로 군집화(Clustering)와 차원 축소(Dimensionality Reduction) 등이 있다. 예를 ..

1.2 머신러닝을 사용하는 이유

목표 머신러닝 시스템을 왜 사용해야 할 지 생각해 보고 우리가 머신러닝을 배우게 되면 어떤 기술에 이 것을 접목 시킬지 고민해 본다. 머신러닝 전체 목차 - https://wondangcom.tistory.com/2769 목차 1 머신러닝을 사용하는 이유 지난 시간에 y=ax+b 와 같은 규칙에서 직관적으로 a=10,b=50을 찾아 y=10x+50 이라는 공식을 유도해서 구할 수 있는 경우라면 굳이 인공지능이 필요하지 않을 수 있다. 하지만 더 복잡한 데이터 혹은 어떤 데이터 값이 수시로 바뀌는 경우는 어떨까? 예를 들어 이메일에서 스팸필터를 만드는 경우를 생각해 보면 전통적인 방법으로 어떤 패턴(예,대출)을 발견하여 그러한 패턴을 발견했을때 스팸으로 걸러 내도록 했다면 스팸을 보내는 사람은 생각하게 된..

1.1 인공지능이란

목표 4차 산업 혁명 시대에 꼭 필요한 인공지능이 무엇인지 살펴 보자. 인공지능,머신러닝,딥러닝의 차이를 확인한다. 머신러닝 전체 목차 - https://wondangcom.tistory.com/2769 목차 1.1 인공지능이란 인공지능(Artificial Intelligence)은 사람처럼 추론할 수 있는 지능을 가진 컴퓨터기술이다. 1943년 워런매컬러와 월터 피츠가 최초로 뉴런 개념을 발표 했고 1950년에 앨런튜링이 인공지능이 사람과 같은 지능을 가졌는지 테스트 할 수 있는 튜링테스트를 발표 하였다. 인공지능은 강인공지능(영화속의 인공지능과 같이 모든 것을 판단하는 지능)과 약인공지능(특정 분야에서 사람의 일을 도와주는 인공지능)으로 분류된다. 현재까지는 약인공지능까지만 구현이 되어 있다. 예) ..

머신러닝 목차

머신러닝1. 머신러닝 소개1.1 인공지능이란(혼공머신) - 4차산업 혁명 시대에 꼭 필요한 인공지능에 대해 알아 보자.링크 :  https://wondangcom.tistory.com/2771(2024.3.7) 1.1 인공지능이란목표 4차 산업 혁명 시대에 꼭 필요한 인공지능이 무엇인지 살펴 보자. 인공지능,머신러닝,딥러닝의 차이를 확인한다. 머신러닝 전체 목차 - https://wondangcom.tistory.com/2769 목차 1.1 인공지능이란 인wondangcom.tistory.com1.2 머신러닝을 사용하는 이유(핸즈온머신러닝) - 머신러닝을 왜 사용해야 하는지 알아 보자.링크 :  https://wondangcom.tistory.com/2772(2024.3.14) 1.2 머신러닝을 사용하는..

머신러닝] 교차검증으로 평가하기

다항 회귀(https://wondangcom.tistory.com/2684) 에서 우리가 과대 적합과 과소적합을 피하는 방법으로 교차검증으로 판단 한다고 언급을 했었다. 여기서는 교차검증은 무엇이고 어떤 원리인지 살펴 보자. 1. 교차검증의 원리 교차 검증은 전체 데이터 세트를 훈련세트와 테스트 세트를 8:2로 나눈 다음 훈련세트에 해당하는 부분을 다시 K개의 덩어리로 나눈다. 그런 다음 1개씩을 따로 떼어서 검증에 사용하고 나머지 4개의 덩어리를 훈련에 사용하는 방식이다. 2. 교차 검증 과정 훈련 세트를 k개의 폴드로 나눈다. 첫번째 폴드를 검증 세트로 사용하고 나머지 폴드(k-1ro)를 훈련 세트로 사용한다. 모델을 훈련한 다음에 검증세트로 평가한다. 차례대로 다음 폴드를 검증 세트로 사용하여 반복..

[캐글(Kaggle) 따라하기]04. 타이타닉 문제 해결하기

학습목표 타이타닉호의 침몰은 역사상 가장 악명 높은 난파선 중 하나입니다. 이 챌린지에서는 어떤 종류의 사람들이 생존할 가능성이 더 높았습니까? 라는 질문에 답하는 예측 모델을 구축하도록 요청합니다. 캐글에서 타이타닉 문제를 해결해 봅니다. 경진대회 참여 1. https://www.kaggle.com/c/titanic 에 접속합니다. 2. Data 카테고리를 클릭하면 다음과 같이 훈련세트와 테스트 세트가 존재합니다. 훈련세트의 필드명의 조건을 확인 합니다. 3. code 를 클릭하여 새로운 노트를 만듭니다. Data 클릭하여 다음과 같이 3개의 파일을 확인 합니다. 4. 데이터 살펴 보기 import pandas as pd train = pd.read_csv('/kaggle/input/titanic/tr..

[머신러닝 따라하기] 01.데이터 준비

도미와 빙어를 분류하는 머신러닝을 만들기 위한 데이터 준비를 알아 보겠습니다. 1. 데이터 준비 먼저 도미와 빙어 데이터가 포함된 데이터를 구하러 가 보시죠. 캐글에는 많은 데이터가 제공되고 있습니다. 캐글에서 제공하는 물고기 데이터를 다운받아 보겠습니다. https://www.kaggle.com/datasets/aungpyaeap/fish-market Fish market Database of common fish species for fish market www.kaggle.com 해당 사이트에 들어가서 Download 버튼을 클릭하여 데이터를 다운 받을 수 있습니다. 다운을 받아 압축을 해제 하면 Fish.csv 파일이 있습니다. 이 파일을 구글 드라이버에 로딩 후 작업을 진행 하겠습니다. 자신의 ..