AI로 러닝(Learn) 내일을 향해 러닝(Running)

원당컴퓨터학원에서 배우는 AI, 세상을 향해 달리다

학생부종합전형

건강보험료는 왜 오르는 걸까요? — 공공데이터로 직접 분석하는 Python 프로젝트

원당컴1 2026. 4. 2. 11:00

건강보험료는 왜 오르는 걸까요? — 공공데이터로 직접 분석하는 Python 프로젝트

"건강보험 재정이 올해 바닥난다."

이런 뉴스를 한 번쯤 들어보셨을 거예요. 그런데 막상 학생들한테 "건강보험이 뭐야?"라고 물어보면 "매달 부모님이 내는 돈?" 정도에서 대답이 끊기는 경우가 많습니다.

그게 당연한 게, 교과서에서 건강보험을 배우기는 하는데 거기서 끝나거든요. 수치를 직접 들여다보거나 데이터로 분석해 본 경험이 없으니까요.

그런데 이걸 반대로 생각해 보면, 바로 여기서 아주 좋은 프로젝트 소재가 생깁니다. 뉴스에서 매일 나오는 이야기를 공공데이터를 직접 가져다가 Python으로 분석하고 시각화해 보는 프로젝트, 생기부에 담기에도 딱이고 진짜 사회 문제를 탐구하는 경험으로도 충분히 의미 있습니다.


이게 어떤 교과랑 연결되냐고요?

이 프로젝트의 출발점은 고1 통합사회입니다.

2022 개정 교육과정 기준 통합사회는 고1이 배우는 공통 과목으로, 시장 경제와 복지, 인권, 지속가능한 사회 등을 다루는데, 시장 경제와 복지 단원에서 사회 보장 제도와 그 한계를 함께 다룹니다. Namu Wiki

통합사회의 시장 경제 단원은 "시장 경제는 인간의 삶에 어떤 영향을 미치는가?"라는 핵심 질문을 중심으로, 시장 경제의 의의와 한계를 극복하기 위한 노력을 탐구하는 방향으로 구성됩니다. X-cdn

건강보험은 그 '시장 경제의 한계를 보완하는 사회 보장 제도'의 대표적인 사례예요. 의료 서비스는 개인이 필요한 시점에 갑자기 비용이 발생하고, 가격이 너무 높으면 저소득층은 아예 이용을 못 하게 되니까 국가가 개입해서 보험 형태로 운영하는 거죠.

그런데 여기서 더 나아가면, 정보 교과의 데이터 수집·분석·시각화와 자연스럽게 연결됩니다. 개념을 배우는 건 통합사회에서 하고, 그 개념의 실제 데이터를 Python으로 분석하는 건 정보 시간의 탐구로 이어지는 거예요.

두 교과가 하나의 탐구 스토리로 연결되는 구조, 학종에서 이게 가장 강력한 생기부를 만들어 냅니다.


어디서 데이터를 가져오냐고요?

이 프로젝트에서 가장 좋은 점 중 하나가, 데이터를 직접 구할 수 있다는 거예요. 숨겨진 게 아니라 누구나 무료로 다운로드할 수 있거든요.

건강보험심사평가원과 국민건강보험공단이 공동 발간하는 건강보험통계연보가 공공데이터포털(data.go.kr)에 공개되어 있는데, 연도별·지역별·연령별 건강보험 재정현황, 진료현황, 질병통계 등이 담겨 있습니다. Korea Data Portal

건강보험심사평가원은 보건의료빅데이터개방시스템(opendata.hira.or.kr)을 통해 진료비 청구 경향, 질병 통계 등의 정보를 누구나 자유롭게 활용할 수 있도록 공개하고 있습니다. Hira

정리하면 학생이 직접 접근할 수 있는 데이터 출처는 크게 세 곳입니다.

공공데이터포털(data.go.kr)에는 건강보험통계연보가 연도별로 올라와 있고, 건강보험심사평가원 보건의료빅데이터개방시스템(opendata.hira.or.kr)에는 질병별·지역별 진료비 데이터가 있습니다. 국민건강보험공단 홈페이지(nhis.or.kr)에서는 보험료 수입·지출 추이 통계를 확인할 수 있어요.

고등학생 수준에서는 공공데이터포털에서 건강보험통계연보 CSV 파일을 받아서 시작하는 게 가장 접근하기 좋습니다.


그럼 실제로 어떤 프로젝트를 만들면 될까요?

1단계 — 건강보험 재정 흐름 시각화

가장 기본적인 프로젝트입니다. 연도별 건강보험 수입(보험료 수입)과 지출(급여비)을 가져와서 그래프로 그려보는 거예요.

 
 
python
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm

# 한글 폰트 설정
plt.rcParams['font.family'] = 'Malgun Gothic'

# 공공데이터에서 다운로드한 건강보험 재정 데이터 불러오기
df = pd.read_csv('건강보험재정현황.csv', encoding='utf-8-sig')

# 연도별 수입·지출 추이 시각화
fig, ax = plt.subplots(figsize=(12, 6))
ax.plot(df['연도'], df['보험료수입'], marker='o', label='보험료 수입', color='steelblue')
ax.plot(df['연도'], df['보험급여비'], marker='s', label='보험급여비 지출', color='tomato')
ax.fill_between(df['연도'], df['보험료수입'], df['보험급여비'],
                alpha=0.1, color='orange', label='재정 격차')

ax.set_title('연도별 건강보험 재정 수입·지출 추이', fontsize=14)
ax.set_xlabel('연도')
ax.set_ylabel('금액 (억원)')
ax.legend()
plt.tight_layout()
plt.show()

단순하게 보이지만, 이 그래프를 직접 그리고 나면 학생 스스로 "어, 지출이 수입보다 빠르게 늘어나고 있네"를 발견하게 됩니다. 그게 탐구의 시작이에요.

2단계 — 고령화와 진료비 증가의 관계 분석

재정이 왜 악화되는지 원인을 파고드는 단계예요. 연령대별 1인당 진료비 데이터를 분석하면 65세 이상 노인 진료비가 전체에서 차지하는 비중이 얼마나 빠르게 늘어나고 있는지 보입니다.

여기에 통계청에서 제공하는 인구 고령화 데이터를 합치면, **"고령화 속도와 건강보험 지출 증가 속도 사이에 어떤 상관관계가 있는지"**를 분석하는 프로젝트로 발전합니다.

pandas의 merge로 두 데이터셋을 합치고, 산점도와 회귀선을 그려보면 꽤 그럴듯한 탐구 보고서가 나와요.

3단계 — 지역별 의료 이용 격차 시각화

같은 보험료를 내는데 지역마다 의료기관 수나 1인당 진료비가 크게 다르다는 사실, 학생들이 직접 데이터로 확인하면 굉장히 놀라거든요.

folium 라이브러리를 활용해서 대한민국 지도 위에 지역별 데이터를 색상으로 표현하는 인터랙티브 지도를 만들 수 있습니다. 이 단계까지 오면 "데이터 분석 + 시각화 + 사회 문제 탐구"가 하나로 합쳐진 완성도 높은 프로젝트가 됩니다.

생기부에 이런 흐름으로 담길 수 있어요.

"통합사회 시간에 사회 보장 제도의 필요성과 건강보험의 구조를 학습한 후, 건강보험 재정 악화 원인이 궁금하여 공공데이터포털에서 건강보험통계연보 데이터를 직접 수집함. Python pandas와 matplotlib을 활용해 연도별 보험료 수입·지출 추이를 시각화하고, 고령화 진행에 따른 노인 진료비 증가 추세를 분석하여 인구 구조 변화와 재정 악화 사이의 상관관계를 탐구함. folium을 활용한 지역별 의료 이용 격차 지도를 제작하고, 지역 의료 불균형 해소 방안을 보고서로 정리함."

이 정도면 통합사회 세특과 정보 세특 두 군데에 동시에 담을 수 있는 내용이 만들어집니다.


기본 프로젝트가 끝났다면, 심화는 어떻게 할까요?

기본 시각화 프로젝트를 완성한 후에 어떤 방향으로 깊어지느냐는 학생의 진로에 따라 달라집니다.

의학·보건 계열을 생각하는 학생이라면

단순히 재정 데이터를 보는 데서 그치지 않고, 질병 통계로 들어가는 게 좋습니다. 건강보험심사평가원에서 제공하는 다빈도 상병(자주 걸리는 질병) 통계 데이터를 가져와서, 연령대별·지역별로 어떤 질병이 많이 발생하는지 분석하는 프로젝트로 이어갈 수 있어요. 여기에 날씨 데이터나 미세먼지 데이터를 결합해서 "환경 요인과 특정 질환 발생률 사이의 관계"를 탐구하면 굉장히 깊이 있는 융합 탐구가 됩니다.

경제·경영 계열을 생각하는 학생이라면

건강보험 재정 데이터를 토대로 재정 고갈 시점 예측 모델을 만들어 보는 방향이 있습니다. Python의 scikit-learn으로 선형 회귀 모델을 만들어서 현재 추세가 이어질 경우 몇 년 후에 적자가 얼마나 커질지 예측해 보는 거예요. 단순 예측 모델이지만, "모델이 전제하는 가정이 무엇인지, 실제로는 어떤 변수가 영향을 미치는지"를 논하는 과정에서 경제적 사고력이 자연스럽게 드러납니다.

사회·복지·공공정책 쪽에 관심 있는 학생이라면

OECD 주요 국가들의 의료비 지출 데이터를 비교하는 국제 비교 분석 프로젝트가 좋습니다. OECD.stat에서 데이터를 가져와서 한국의 의료비 지출 수준, GDP 대비 비율, 보험 보장률 등을 다른 나라와 비교하고 시각화해 보는 거예요. "한국 건강보험의 강점과 약점이 무엇인지, 어떤 나라의 시스템을 참고할 수 있는지"까지 탐구를 이어가면 사회탐구 과목 세특과도 연결됩니다.

컴퓨터공학·AI 계열을 생각하는 학생이라면

머신러닝을 접목하는 방향으로 심화할 수 있습니다. 연령, 지역, 진료과목, 계절 등 여러 변수를 활용해서 특정 조건에서의 진료비를 예측하는 모델을 만들어 보거나, 질병 발생 패턴에서 이상값(anomaly)을 탐지하는 모델을 구현해 보는 프로젝트가 있어요. Python 융합과정에서 배운 머신러닝 내용이 실제 사회 문제에 적용되는 경험을 할 수 있습니다.


이 프로젝트가 생기부에서 강한 이유

학종에서 입학사정관들이 주목하는 탐구 기록의 공통점이 있습니다. 수업 시간에 배운 개념에서 출발해서, 스스로 자료를 찾고, 직접 분석하고, 거기서 새로운 질문이 생겨 더 깊이 파고든 흐름이에요.

이 프로젝트가 딱 그 흐름입니다.

통합사회에서 "사회 보장 제도가 필요한 이유"를 배우고 → "그럼 실제 우리나라 건강보험 재정은 어떤 상태야?"라는 질문이 생기고 → 공공데이터를 직접 수집해서 Python으로 분석하고 → "고령화가 진짜 주요 원인이구나, 지역마다 이렇게 차이가 나는구나"를 발견하고 → 그 발견에서 또 새로운 질문이 생기는 것.

이 전체 과정이 생기부 한 칸에 담기면, 읽는 사람 입장에서 "이 학생 그냥 외운 게 아니구나"가 자연스럽게 느껴집니다.

뉴스에서 스쳐 지나가는 이야기 하나가 이렇게 깊은 탐구로 이어질 수 있어요. 저희 원당컴퓨터학원 Python 융합과정에서는 이런 방식으로 사회 현상과 데이터 분석을 연결하는 프로젝트 수업을 진행하고 있습니다. 단순히 pandas 사용법을 가르치는 게 아니라, 학생이 직접 궁금한 문제를 데이터로 탐구하는 경험을 쌓을 수 있도록 함께 고민해 드려요. 궁금하신 분은 편하게 연락 주세요! 😊

📍 원당컴퓨터학원 인천시 서구 당하동 장원프라자 502호 ☎ 032-565-5497


#원당컴퓨터학원 #건강보험데이터분석 #공공데이터활용 #Python데이터분석 #학생부종합전형 #학종준비 #생기부세특 #통합사회세특 #정보세특 #건강보험재정 #데이터시각화 #pandas #matplotlib #folium #고령화분석 #인천코딩학원 #서구코딩학원 #당하동학원 #Python융합과정 #사회문제코딩

사업자 정보 표시
원당컴퓨터학원 | 기희경 | 인천 서구 당하동 1028-2 장원프라자 502호 | 사업자 등록번호 : 301-96-83080 | TEL : 032-565-5497 | Mail : icon001@naver.com | 통신판매신고번호 : 호 | 사이버몰의 이용약관 바로가기
📌 원당컴퓨터학원 | 인천 서구 당하동 장원프라자 502호
📞 032-565-5497
🌐 홈페이지: www.wondangcom.com
💬 카카오 문의: 카카오톡 상담