기타/도서리뷰

[나는 리뷰어다] 어쩌다 데이터 분석 With 파이썬

파아란 기쁨 2022. 10. 21. 10:29

 

지은이는 UX관련 전공을 한 후 데이터 관련 업무를 하면서 필요한 지식을 공부하면서  '원리 이해 -> 실습과 실행 -> 나만의 정리' 라는 과정을 반복하는 것을 터득하면서 이 책을 입문자 입장에서 책을 쓰기 시작하였다고 합니다.

전공자는 전공자의 눈으로 쓰다 보니 조금은 어렵게 작성되는 부분이 있는데~

이 책은 비전공자의 시각으로 글을 작성하여 구성 또한 입문자의 입장에서 전혀 부담없는 구성으로 이루어져 있습니다.

 

구성을 살펴 보면 다음과 같습니다.

1장 데이터 분석 준비

파이썬의 기본 내용과 데이터 분석을 위한 핵심라이브러리(넘파이,판다스,맷플롯립,시본)등을 살펴 봅니다.

2장 데이터 분석 기본

데이터 분석의 기본이 되는 넘파이,판다스 등을 이용해 데이터를 로딩 하고 컬름을 다루는 테크닉에 대해 알아 봅니다.

3장 데이터 정제와 응용

조건식을 활용해서 데이터를 필터링 하는 방법과 결측값,이상값 등을 처리하는 방법을 살펴 봅니다.

4장 데이터 병합과 재형성

서로 다른 데이터프레임을 병합 하거나 특징들을 합해서 새로운 형태의 데이터를 만드는 방법 들에 대해 다루고 있습니다.

5장 데이터 집계와 그룹연산

같은 그룹의 데이터를 집계하거나 피벗 테이블과 크로스탭을 활용하는 방법을 살펴 봅니다.

6장 날짜시간 데이터 처리

날짜 타입의 데이터를 처리하는 방법에 대해 살펴 봅니다.

7장 데이터 시각화

맷플립롭과 시본을 이용해서 각 특징들의 그래프를 이용하여 시각화 하는 방법 등을 살펴 봅니다.

 

서평

제가 이 책을 신청한 이유는 인공지능을 공부하면서 데이터 분석하는 것이 어렵기 때문에 자유자재로 데이터를 다루고 싶어서 신청하게 되었습니다.

이 책을 읽으면서 느끼는 것은 데이터 분석의 최고의 입문서가 되지 않을까 라는 생각을 했는데요~

그 이유는 다음과 같습니다.

1. 입문자를 고려해서 파이썬의 중요한 문법을 다시한번 훑어 본다.

파이썬의 기본 문법을 정리했다.

 

2. 데이터 분석의 기본이 되는 넘파이와 파이썬에 대해 상세하게 다루고 있다.

잘 몰랐던 판다스의 옵션을 하나 하나 살펴 볼 수 있다.

 

3. 데이터를 정제하는 방법 과 시각화 툴을 다루는 방법을 상세하게 다루고 있다.

시각화 툴에서 color을 지정하는 방법 외에 다양한 옵션을 활용하는 방법을 보여주는 예

 

 

제가 생각하는 인공지능은 빅데이터를 이용해서 확률을 계산하는 알고리즘인데요~

빅데이터에는 확률을 계산하는데 필요 없는 쓸모 없는 데이터들이 많이 존재하게 됩니다.

인공지능을 공부하다 보면 처음 접하는 문제가 타이타닉에서 생존률을 구하는 문제를 먼저 만나게 되는데요~

타이타닉 문제에서 티켓번호 같은 경우 생존률과 전혀 무관한 데이터 입니다. 오히려 나이/성별 같은 경우는 어린 아이나 고령의 나이 인 경우 살 확률이 높았고 여성인 경우 남성보다 살 확률이 높았습니다.

하지만 빅 데이터에서는 이렇게 우리가 알 수 있는 특징들만 주어지는 것은 아닙니다.

이것이 어떤 특징 데이터 인지 모르는 상황에서 데이터를 분석해야 하는 경우도 많고 어떤 특징이 결과에 영향을 끼치는지 알 수가 없습니다.

이럴 때 데이터 분석이 필요한데 판다스나 넘파이, 시각화 툴을 이용해서 데이터 분석을 통해서 어떤 특징들이 훈련에 필요한 데이터 인지를 찾아 낼 수 있는데요~

 

이 책은 이러한 데이터 분석이 필요한 분들에게 너무나 유용한 책인 것 같네요.

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

사업자 정보 표시
원당컴퓨터학원 | 기희경 | 인천 서구 당하동 1028-2 장원프라자 502호 | 사업자 등록번호 : 301-96-83080 | TEL : 032-565-5497 | Mail : icon001@naver.com | 통신판매신고번호 : 호 | 사이버몰의 이용약관 바로가기