책소개
이 책은 총 3부 15개의 장으로 구성이 되어 있으며
1부에서는 캐글 사용법에 대해 다루면서 캐글 대회,데이터세트,노트북 환경 및 토론포럼 사용 방법등을 다루고 있다.
2부에서는 대회를 위한 테크닉으로 대회 과제와 지표,좋은 검증 설계법,대회를 위한 모델링, 하이퍼파라미터 최적화 등 한단계 업그레이드 할 수 있는 테크닉을 다루고 있다.
3부에서는 데이터과학 경력 관리 방법으로 포트폴리오 준비와 같이 데이터 과학자로서의 경력 관리 방법을 다루고 있다.
이 책의 목적은 단순히 캐글 대회에서 우승하거나 높은 점수를 받는 법을 알리기 위한 목적이 아닌 캐글 대회를 다루는 방법과 그 경험을 최대한 활용하는 방법을 담고 있으면서 캐글플랫폼을 이용해서 자신의 역량을 키우기 위한 이유로 집필이 되었다.
또한 그랜드마스터급 캐글러 31명의 인터뷰를 수록해서 그들이 실제 일상 업무에서 사용했던 경험등 다양한 노하우를 공유하여 처음 도전하는 캐글러들에게 어떠한 방향으로 공부를 해야 할지 알려주는 지침서이다.
대상독자
캐글을 통해 대회에 참가하고 머신러닝을 학습하는 모든 분
서평
머신러닝을 공부하다 보면 반드시 만나게 되는 캐글은 실습을 통한 학습 경험을 제공하는데 이러한 캐글의 경험은 머신러닝을 위한 근력운동과 같다.
캐글의 다양한 사례와 문제를 접하다 보면 실제로 만나게 되는 문제의 유사한 상황에도 대비가 되고 또한 데이터 과학자로서의 경력 관리 방법의 하나로서도 유용하다.
이 책은 제목과 같이 캐글러로서 성장하는 방법의 로드맵을 그려주고 있다.
처음에 캐글 사용법에서 부터 대회를 위한 테크닉을 차근 차근 들여다 보면서 최근에 인기를 얻고 있는 시뮬레이션 대회까지 캐글 그랜드마스터의 비법과 문제 풀이 방법등을 살펴 보고 있고 또한 이 책을 읽는 분들이라면 데이터 과학자로서의 진출을 바라보는 분들이기 때문에~
캐글로 포트폴리오를 구축하는 방법, 온라인에 자신의 존재감 드러내기 등을 통해 자신의 역량을 증명하는 방법등 까지 데이터 과학자로서 포트폴리오 관리 방법 등까지 다루고 있다.
특히나 31명의 그랜드 마스터급 인터뷰 내용에서 다음의 글은 인상에 깊이 남는다.
저는 훌륭한 질문을 하는 것이 데이터 과학자가 직면한 가장 중요한 도전이라고 생각해요.(중략) 훌륭한 질문을 던지는 건 자동화 하기 어렵습니다.
현재 인공지능이 우리 시대에서 하는 역할들을 감안 할 때 자동화된 솔루션들이 대부분의 역할들을 대체 하게 될 것이다. 하지만 인공지능이 제대로 일을 할 수 있도록 질문을 하는 것은 자동화 되기 어려울 것이다.
데이터과학자뿐 아니라 인공지능을 이용하는 우리에게도 꼭 필요한 내용이었던 것 같다.
마지막으로 이 책은 데이터과학자의 진로를 꿈꾸고 있는 분들이라면 필수로 만나 봐야 할 책이 아닐까 싶다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
'기타 > 도서리뷰' 카테고리의 다른 글
하루만에 끝내는 챗GPT 활용법 (18) | 2023.06.13 |
---|---|
Do it! BERT와 GPT로 배우는 자연어 처리 (16) | 2023.05.16 |
[나는 리뷰어다] 게임전쟁 (13) | 2023.04.13 |
[나는 리뷰어다] 핸즈온 리액트 네이티브 (11) | 2023.03.15 |
[나는 리뷰어다] 실전에서 바로 쓰는 Next.js (14) | 2023.02.14 |