오늘 리뷰 할 책은 혼자 공부하는 머신러닝입니다.
이 책을 읽게 된 이유는 우연하게 유튜브에서 박해선님의 혼자공부하는 머신러닝 강의를 들으면서 혼공머신의 활약상이 기대 되었기 때문입니다.
한빛 마켓 오픈 준비를 하면서 빙어와 도미를 구분하기 위해 혼공머신이 최근접이웃을 활용하여 빙어와 도미를 구분하는 머신러닝을 만들어 내고, 가장 간단하게 만들어진 최근접 이웃으로 만들어낸 머신러닝에게는 약점이 있을 수 밖에 없었는데요. 그러한 약점은 크기와 무게의 단위가 다른 점 때문에 단위를 같게 만들어야 하는 스케일링 기법이 필요할 수 밖에 없겠구나 라는 사실을 스스로 깨닫게 되는 마법같은 이야기~
기존에는 피처 엔지니어링 기법으로 스케일링은 각 변수의 데이터 범위가 다를때 일정하게 맞춰주는 기법과 같이 딱딱하게 다가 오던 내용들이 이 책을 읽으면서는 왜 그 상황에서 스케일링 기법이 필요한지 그렇게 하기 위해서는 어떻게 해야 되는지 를 설명해 주니 정말 머리에 쏙쏙 잘 들어 오더라구요~
그리고 이제 한빛마켓이 성장을 해서 이제는 도미를 무게 단위로 판매를 시작하네요.
무게를 예측해 봐야 할것 같아요~
이러한 무게 예측도 최근접 이웃으로 가능합니다. 하지만 훈련 데이터 범위 안에서 측정하는 것은 제대로 측정이 되는데 훈련데이터 범위 밖의 데이터가 입력 되면 엉뚱한 방향으로 예측을 하게 되네요. 해결 방법은 바로 선형 회귀 입니다. 선형 회귀는 데이터에서 직선의 데이터를 예측 할 수 있는 알고리즘이기 때문에 범위를 벗어난 데이터도 잘 맞출 수가 있습니다. 하지만 데이터가 항상 일직선의 데이터만 있는 것은 아니네요~ 2차 방정식 형태의 데이터를 해결해야 하는 다항회귀를 알고 넘어가야만 합니다.
이 처럼 이 책의 내용은 흥미를 유발하여 다음 장에서는 무엇을 배우게 될까? 라는 궁금증을 유발하는 책이네요.
그리고 혼공머신과 함께 한단계 한단계 성장하면서 나 자신이 머신러닝에 대해 쑤욱~ 성장해 나가는 모습을 볼 수 있는 것 같아요.
이렇게 하나 하나 따라 가다 보면 어느 새 로지스틱회귀,확률적 경사하강법,결정트리,교차검증과 그리드서치,트리의 앙상블, 비지도 학습의 군집알고리즘,k-평균,주성분분석, 이미지 분류를 위한 인공신경망,심층신경망,합성곱 신경망과 마지막으로 텍스트를 위한 인공신경망까지 개념을 이해 할 수 있는 모습을 확인 할 수 있었습니다.
또한 실습도 파이썬 프로그램 설치와 같은 과정들을 생략하고 구글에서 제공해 주는 코랩을 이용하여 쉽게 실습을 진행해 볼 수 있어서 정말 최적의 실습환경이 아닐까 라는 생각도 들었네요~
실제로 실습환경을 구축하면서 구축이 잘 안 되거나 하다 보면 진행속도도 느려지고 공부에 흥미를 떨어뜨릴 요소도 다분하거든요.
입문자에게 머신러닝은 참으로 쉽지 않은 것 같습니다. 여러개의 책을 살펴 보아도 대부분의 책은 머신러닝이란 이런거야 하고 소개하는 책과 아니면 머신러닝의 알고리즘을 설명하는 깊이 있는 책과 같이 중간 부분을 설명하는 책이 많지 않아서 입문자가 보기에 이 두개의 연결 다리를 해 줄 만한 책이 많지 않아서~
정말 이리 부딪히고, 저리 부딪히면서 조금씩 조금씩 깨우치는 방법 밖에는 없었는데요.
박해선님이 많은 머신러닝 관련한 책을 번역하시고 또한 책을 쓰시면서 입문자의 가려운 부분을 정확하게 짚어 내신 책인 것 같은 생각이 드네요.
이 책은 처음부터 마지막까지 흥미진진하게 내가 이 책속의 주인공이 되어서 문제를 해결하면서 모험을 떠나는 여행 같은 느낌으로 읽을 수 있었습니다.
'기타 > 도서리뷰' 카테고리의 다른 글
[예스24리뷰어] 계열합격 끝판왕 공학계열 (8) | 2022.09.21 |
---|---|
[나는 리뷰어다] 개발자를 위한 머신러닝&딥러닝 (6) | 2022.09.14 |
[나는리뷰어다]혼자 공부하는 컴퓨터구조+운영체제 (13) | 2022.08.25 |
[북스포일러] 데싸노트의 실전에서 통하는 머신러닝 (13) | 2022.08.18 |
[예스24리뷰어] 미치도록 기발한 수학 천재들 (6) | 2022.08.09 |