아마존 자연어 처리 분야 베스트 셀러인 트랜스포머를 활용한 자연어처리가 출판 되었네요.
저는 트랜스포머라고 하면 자동차로봇만을 생각하고 있었는데~
이렇게 인공지능 분야에서 사용하는 자연어처리 라이브러리 라고는 생각도 못했었네요.^^
트랜스포머는 2017년에 구글 연구팀이 발표한 논문에 제안된 신경망 아키텍처로 긴 시퀀스 데이터에서 패턴을 감지하고 대용량 데이터셋을 처리하는데 뛰어난 모델으로 NLP를 넘어서 이미지 처리 등의 작업에도 사용 된다고 합니다.
이 책은 트랜스포머스 라이브러리의 개발자들과 허깅페이스의 오픈소스 개발자들이 공동 집필을 했고 박해선님이 번역을 한 트랜스포머 라이브러리와 이를 둘러싼 생태계까지 전 영역을 아우르는 책입니다.
그럼 트랜스포머를 만나러 가 보시죠~
구성
1장 : 트랜스포머 소개 및 관련 용어, 허깅페이스 생태계 소개
2장 : 감성 분석 작업에 초점을 두고 Trainer API 소개
3장 : 트랜스포머 아키텍처 설명
4장 : 다국어 텍스트에서 개체명을 인식
5장 : 텍스트를 생성하는 트랜스포머 모델의 능력을 탐구
6장 : 시퀀스-투-시퀀스 작업을 살펴 보고 이 작업에 사용하는 측정지표 살펴 보기
7장 : 리뷰 기반 질문 답변 시스템 구축
8장 : 모델 성능을 살펴 보고 지식정제,양자화,가지치기 기술을 탐색
9장 : 레이블링 된 대량의 데이터가 없을 때 모델 성능을 향상할 방법을 살펴 본다.
10장 : 파이썬 소스 코드를 자동 완성하는 모델을 밑바닥 부터 만들고 훈련하는 방법을 알려 준다.
11장 ; 트랜스포머 모델의 도전 과제와 흥미로운 신생 연구 분야를 소개한다.
서평
이 책은 파이토치를 기반으로 설명을 하였지만 텐서플로를 사용하였다고 해도 문제가 없도록 텐서플로 기반에서 어떻게 트랜스포머스를 사용하는지에 대해서 자세히 다루고 있습니다.
또한 이해하기 쉽게 필요할 때마다 그림을 삽입해서 더욱 이해도를 높여 주었습니다.
그리고 이 책은 실습 주도 방식으로 구성이 되어 있어서 직접 실습을 통해서 결과물을 눈으로 보면서 어떤 형식으로 동작하는지의 원리를 깨닫게 해 주는 구성이 좋았던 것 같습니다.
다음은 허깅페이스 허브에서 무료로 공개된 20000여개의 모델 중에서 영어를 독일어로 번역하는 모델(opus-mt-en-de)를 활용하여 단 3줄로 영어를 독일어로 번역하는 예제입니다.
코랩에서 이 세줄을 입력하여 실행을 해 보면 다음과 같이 멋지게 번역된 결과(사실 저는 번역이 완벽히 되었는지 판단을 할 수가 없다는 사실이.ㅠ.ㅠ)가 출력 됩니다.
또한 허깅페이스 허브에서 사전 학습된 모델을 사용하여 미세조정을 통해 자신이 원하는 모델을 만들어 내는 방법을 다루고 있기 때문에~
사전학습된 모델을 사용하여 자신에게 맞는 새로운 모델을 만들어서 실무에서 사용할 수 있는 활용을 원하시는 분들에게더욱 필요한 책이 아닐까 생각이 되네요.
또한 트랜스포머 아키텍처와 허깅페이스 생태계를 배우고 싶다면 이 책을 읽어보시면 좋을 것 같습니다.
이 책을 읽으면서 허깅페이스의 트랜스포머스 라이브러리의 자연어 처리 부분 뿐 아니라 딥러닝 전 영역으로의 영향력을 살펴 볼 수 있었던 것 같습니다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
깃허브 저장소 - https://github.com/rickiepark/nlp-with-transformers
'기타 > 도서리뷰' 카테고리의 다른 글
[나는 리뷰어다] 실전에서 바로 쓰는 Next.js (14) | 2023.02.14 |
---|---|
나는 리뷰어다 2023 모집 안내 (8) | 2022.12.28 |
[예스24리뷰어] 파이썬 딥러닝 케라스 (10) | 2022.11.18 |
[나는 리뷰어다] 온디바이스 AI (9) | 2022.11.14 |
[나는 리뷰어다] 어쩌다 데이터 분석 With 파이썬 (8) | 2022.10.21 |