요즘 4차산업혁명시대가 대두 되면서 인공지능이나 빅데이터 관련된 부분이 이슈가 되고 있는데요...
그 중에서 빅데이터 관련되어 R 데이터 분석이나 통계 관련된 내용을 심심치 않게 볼수가 있었어요.
그런데 저는 아직 R 프로그래밍이란 것이 무엇인지 접해 볼 생각도 못했고 접해 보지도 않았었는데 이번에 한빛미디어에서 출판된 처음시작하는 R데이터 분석이라는 책을 만나게 되었네요.
처음 보았을때 첫 표지에 7일 완성 로드맵이라는 글자가 왠지 거슬리더라구요.^^
일반적으로 책을 사면 20일 완성... 몇일 완성 이렇게 되어 있는데 정말 책을 읽다 보면 그 몇일안에 완성하는 것이 얼마나 어려운지 매번 깨닫기 때문에 이 R데이터도 어떻게 7일만에??? 라는 느낌을 갖고 있으면서 책장을 넘겨 보았어요.
하지만 책장을 덮을때 쯤에는 7일 완성 로드맵을 적어 놔도 되겠다는 생각을 갖게 되더라구요.
1장에서는 빅데이터와 R의 장점과 단점, R프로그래밍 설치 하고 실행하는 방법 들에 대해서 다루고 있는데요...
저는 1장을 보면서 가장 좋았던 부분은 한입에 쏙 부분이었어요.
R 스튜디오를 설치 하고 나서 단축키를 사용하는 방법에 대해서 자세히 다뤄 놓았더라구요. 일반적으로 프로그래밍을 다룰때 단축키를 사용하는 부분은 코딩하는 속도를 무척이나 단축 시켜 주지만 이렇게 정리가 되어 있지 않으면 익숙해 질 때까지 단축기가 무엇인지 찾는데 많은 시간을 허비 하는 경우가 많기 때문에 이렇게 주로 사용하는 기능들에 대해서 정리 해 놓은것이 참 마음에 들더라구요.
2장부터는 본격적으로 R프로그래밍을 사용하기 위한 준비 작업과 문법적인 부분들을 설명하고 있는데요.
이 책을 읽다 보니 처음에는 파이썬 인가? 라는 생각이 들었네요.^^
사용하는 방법이 무척이나 파이썬과 닮아 있었기 때문이었는데요. 파이썬 만큼 많은 기능이 있지는 않다고 하네요.^^ 대신에 데이터 가공하는 면에서는 월등하기에 빅데이터 관련 프로그래밍이겠죠.^^
4장 이후에 본격적인 빅데이터 관련된 자료를 보면서 엑셀기능과 많이 유사하구나 하는 생각이 들었는데요.
이러한 엑셀이나 TXT 데이터를 불러 와서 데이터 가공하는 능력이 정말 대단하다는 생각이 들더라구요.
물론 자료를 가공하기 위해서는 명령어를 알고 넘어 가야겠지만 일반적인 TXT 파일로 된 데이터를 이렇게도 가공할 수 있겠구나 하고 느끼게 되었네요.
제가 엑셀을 그렇게 썩 잘하지는 못하지만 엑셀에서 구현하지 못하는 기능들(제가 엑셀을 전체를 다 알고 있지는 못해서 어쩌면 구현이 가능 할수도 있습니다.) 을 단 몇줄의 코드로 데이터를 가공하는데는 정말 신선한 충격을 받기도 했네요.
마지막 파트 데이터분석 실전 프로젝트에서는 치킨집이 가장 많은 지역 찾기 또는 지역별 미세먼지 농도 비교하기 등....
실제 사이트에서 데이터를 다운 받아서 가공하면서 R 프로그래밍을 직접 다루기도 하고 트위터 API를 활용하여 위드클라우드로 표현하는 방법등을 실습하면서 R 프로그래밍의 매력에 빠져 볼 수 있었네요.
자세한 정보는 한빛미디어 홈페이지 - http://www.hanbit.co.kr/store/books/look.php?p_code=B6952054209 에서 미리보기를 해 보실 수 있습니다.
이 책을 읽기 전에는 R 프로그래밍이 무엇인지 무척 궁금하기만 했었는데...
이 책을 읽고 나니 R 프로그램이란것이 무엇인지 알 수 있게 된것 같네요.
이 책은 갑자기 R 프로그래밍을 해야 하는분이 쉽게 접근 할 수 있게 구성이 되어 있고요.
프로그래밍을 전혀 모르는 사람도 그냥 교재에서 나오는 데로 따라만 하면 하나 하나 결과를 볼 수 있게 구성이 되어 있어서 누구라도 무난하게 따라 할 수 있을것 같네요.
특히나 제가 생각하는 장점은 실습위주라서...( 사실 프로그래밍 공부는 실습 하고 결과 나오면서 문법을 분석하는 것이 좀더 실감 나는 것 같아요) 지루 하지 않게 볼 수 있는 점이라고 생각 하고요.
회사 관리자 분들도 그냥 가볍게 R 프로그래밍이 무엇인가 하고 보셔도 괜찮을것 같아요.
이 책을 읽다 보면 이런 데이터를 이렇게도 가공할 수 있네? 라는 생각이 드니 엑셀에서 어렵게 가공하거나 데이터베이스에서 테이블 만들어서 가공하고 다시 추출하고 이러한 과정 없이도 명령어 몇개에 가공 되는 것을 보면...
업무 특성에 맞춰서 어떤 것을 사용하면 좋을지 안내해 주는 역할을 하셔도 손색이 없을것 같네요.^^
그리고 실제 업무를 하시는 분들도 그냥 가볍게 읽어 보시고 엑셀에서 처리하지 못했던(?) 아니면 어렵게 가공해야 했던 일들을 가볍게 가공할 수 있다는 것을 배워 두시면 데이터 가공 할때 특성에 맞게 사용하신다면 선택의 폭이 넓어질 것이라고 생각이 드네요.
학생들 입장에서는 나중에 업무에서 필요할때 읽어 봐도 될만한 책이라고 생각되기에 미리 공부해 둘 필요는 없을것 같아요.
그래도 궁금한 학생이 있다면 훑어 보면서 이런 기능들이 있고 이런 것을 만들때 사용하면 좋겠다 라는 정도로 이해 해 둔다면 혹시라도 나중에 프로젝트 할때 많은 부분에서 유리 할 수는 있겠네요.^^
이 책은 한빛미디어 "나는 리뷰어다" 에서 제공받았습니다.
'기타 > 도서리뷰' 카테고리의 다른 글
do it 오라클로 배우는 데이터베이스 입문 책을 읽고 (12) | 2018.11.16 |
---|---|
오준석의 안드로이드 생존코딩- 코틀린편 (11) | 2018.11.02 |
밥벌이의미래 (8) | 2018.09.28 |
초등학생도 이해하는 확률과 통계 (7) | 2018.08.27 |
혼자서도 쉽게 익힐 수 있는 자기주도 C언어 프로그래밍 (3) | 2018.08.21 |