2025년, 코딩은 선택이 아닌 필수!

2025년 모든 학교에서 코딩이 시작 됩니다. 먼저 준비하는 사람만이 기술을 선도해 갑니다~

소프트웨어중심대학

[학생부 종합전형] 학생부 사례로 살펴보는 프로젝트 예시

원당컴1 2025. 2. 21. 20:57

https://wondangcom.tistory.com/2943

지난 시간에 학생부 종합전형 사례에서 지구과학 시간에  기후변화 예측 모델 제작을 한 내용이 있어서 프로그램을 이용해서 어떤 식으로 활용하는지 살펴 보도록 하겠습니다.

1. 데이터 다운로드

1. 기상자료개방포털에서 데이터 다운로드

https://data.kma.go.kr/climate/average30Years/selectAverage30YearsKoreaFileset.do?pgmNo=716

 

기상자료개방포털[기후통계분석:평년값:우리나라 기후평년값]

Home 기후통계분석평년값우리나라 기후평년값 우리나라 기후평년값 기후평년값은 ‘0’으로 끝나는 해의 최근 30년간의 누년평균값으로 정의됩니다. 기후평년값은 현재 기상에 대한 비교와 기

data.kma.go.kr

1991~2020년 데이터를 다운받아서 엑셀 파일을 다운받아서 다음과 같이 헤더 부분을 수정하여 CSV 파일 포맷으로 변경하였습니다.

우리나라기후평년(일별)_1991.csv
4.54MB

코랩에서 작성할 것이므로 코랩에 파일을 업로드 하였습니다.

2. 데이터 전처리

1. 데이터 로드

import pandas as pd

df = pd.read_csv('/content/우리나라기후평년(일별)_1991.csv', encoding='utf-8')
print(df.head())

2. 관측 지점명 확인

- 관측한 지점명이 어떤 것들이 있는지 확인해 보겠습니다.

print(df['지점명'].unique())

저희 동네가 인천이라서 인천 데이터만 추출해 보도록 하겠습니다.

3. 인천 데이터 추출

incheon_df = df[df['지점명'] == '인천']
incheon_df

우리는 평균기온만 예측을 해 볼 예정입니다.

따라서 월,날짜,평균기온 만 데이터로 남겨 놓겠습니다.

incheon_df = incheon_df[['월', '날짜', '기온(℃)평균기온']]

print(incheon_df.head())

4. 결측치 처리

- 데이터 내 결측치를 확인하고 처리합니다.

print(incheon_df.isnull().sum())

결측치는 없네요~

- 특성명을 처리 합니다.

# 특성 추가
incheon_df['Year'] = 2024 #임의로 2024년도 데이터로 가정함

# 특성명 변경
incheon_df = incheon_df.rename(columns={'월':'Month','날짜':'Day','기온(℃)평균기온': 'Temperature'})
incheon_dff

4. 모델 생성 및 훈련

import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, LSTM
from tensorflow.keras.callbacks import EarlyStopping

# 월, 일 데이터를 시계열 데이터로 변환
data['Date'] = pd.to_datetime(data[['Year', 'Month', 'Day']])
data.set_index('Date', inplace=True)
data = data[['Temperature']]

# 데이터 정규화
scaler = MinMaxScaler()
scaled_data = scaler.fit_transform(data)

# 시계열 데이터셋 생성
def create_dataset(data, time_step=1):
    X, y = [], []
    for i in range(len(data)-time_step-1):
        a = data[i:(i+time_step), 0]
        X.append(a)
        y.append(data[i + time_step, 0])
    return np.array(X), np.array(y)

time_step = 30  # 30일 동안의 데이터를 사용하여 다음 날의 온도 예측
X, y = create_dataset(scaled_data, time_step)

# 데이터 차원 변환
X = X.reshape(X.shape[0], X.shape[1], 1)

# 훈련 데이터와 테스트 데이터 분리
train_size = int(len(X) * 0.8)
test_size = len(X) - train_size
X_train, X_test = X[0:train_size], X[train_size:len(X)]
y_train, y_test = y[0:train_size], y[train_size:len(y)]

# LSTM 모델 생성
model = Sequential()
model.add(LSTM(50, return_sequences=True, input_shape=(time_step, 1)))
model.add(LSTM(50, return_sequences=False))
model.add(Dense(25))
model.add(Dense(1))

# 모델 컴파일
model.compile(optimizer='adam', loss='mean_squared_error')

# 모델 훈련
early_stop = EarlyStopping(monitor='val_loss', patience=10)
model.fit(X_train, y_train, batch_size=1, epochs=100, validation_data=(X_test, y_test), callbacks=[early_stop])

# 모델 평가
train_predict = model.predict(X_train)
test_predict = model.predict(X_test)

# 데이터 역정규화
train_predict = scaler.inverse_transform(train_predict)
test_predict = scaler.inverse_transform(test_predict)

# 온도 예측 함수
def predict_temperature(data, time_step, model):
    data = scaler.transform(data)
    data = data.reshape((1, time_step, 1))
    prediction = model.predict(data)
    prediction = scaler.inverse_transform(prediction)
    return prediction[0][0]

시계열 데이터로 LSTM 모델을 사용하였습니다.

시계열 데이터셋은 30일 동안의 데이터를 사용하여 다음날의 온도를 예측 할 수 있도록 하였습니다.

훈련 데이터 80프로 테스트 세트 20프로로 사용하여 LSTM 모델로 최대 100번 훈련을 하며 조기종료 옵션으로 훈련이 조기에 끝날 수 있도록 하였고 온도 예측 함수는 훈련할때 정규화 한 것을 역정규화 하여 원래 값으로 변경하는 함수입니다.

58번만에 조기 종료 되는 것을 알 수 있습니다.

2025년 1월 10일 날짜의 온도를 예측해 보도록 하겠습니다.

5. 온도 예측

month = 1
day = 10

# 예측을 위한 데이터 생성
date_str = f'2025-{month:02d}-{day:02d}'
date_data = pd.date_range(end=date_str, periods=time_step).to_frame(index=False, name='Date')
date_data = pd.merge(date_data, data, how='left', on=['Date'])
date_data = date_data[['Temperature']].fillna(method='ffill').values

predicted_temperature = predict_temperature(date_data, time_step, model)
print(f'Predicted temperature on {month}/{day}: {predicted_temperature}')

-1.07 로 예측했네요~

현재는 데이터셋을 1990~2000년 데이터셋을 사용하였는데 최근 데이터셋을 사용하면 30일치의 데이터를 활용해서 내일 날짜의 온도를 예측 할 수가 있을것 같습니다.

 

이런 식으로 프로젝트 수행 후 다음과 같은 형태의 보고서를 작성 할 수 있겠네요.

I. 서론

 

1. 탐구의 배경 및 목적

 

가. 탐구의 배경

현재 전 세계는 급격한 산업화와 인간 활동의 증가로 인해 기후변화와 지구 온난화라는 중대한 문제에 직면해 있습니다. 지난 수십 년간 온실가스 배출량이 지속적으로 증가하면서 대기 중 농도가 높아졌고, 이로 인해 기후 및 날씨 패턴이 급격하게 변화하고 있습니다. 이러한 현상은 단순히 기후적 변화에 머무르지 않고, 농업, 생태계, 인간 건강, 국가 경제 등 다양한 분야에 걸쳐 심각한 영향을 미치고 있습니다. 특히, 우리나라를 포함한 전 세계 여러 지역에서는 폭염, 가뭄, 홍수 등 극한 기후 현상이 빈번히 발생하여 이에 대한 예방과 대비가 시급한 과제로 대두되고 있습니다. 고등학교 지구과학 수업에서 기후변화의 원인과 그 영향에 대해 배우면서, 저는 기후변화의 복잡한 메커니즘과 더불어 이를 예측할 수 있는 방법론에 큰 관심을 가지게 되었습니다. 이러한 관심은 기후변화 문제의 심각성을 인식하고, 미래 사회의 안전과 지속 가능한 발전을 위해 과학적 근거에 기반한 예측 모델을 개발해야 한다는 결심으로 이어졌습니다. 인공지능(AI) 기술의 발전과 함께 LSTM(Long Short-Term Memory)와 같은 심층 학습 모델은 시계열 데이터 분석에 탁월한 성능을 보여주고 있으며, 이를 기후변화 예측에 적용하면 기존의 통계적 모델보다 더욱 정확한 예측 결과를 기대할 수 있다는 점에서 본 탐구의 출발점이 되었습니다.

 

나. 탐구의 목적

본 연구의 주된 목적은 기후변화 예측을 위한 인공지능 기반 LSTM 모델의 개념을 이해하고, 이를 실제 기후 데이터 분석에 적용하여 미래의 온도 변화를 예측하는 모델을 개발하는 데 있습니다. 구체적으로는 지난 10년간 기상자료 개방 포털을 통해 수집한 온도 데이터를 기반으로 데이터 전처리, 모델 설계, 학습, 평가의 전 과정을 체계적으로 수행하고, 이를 통해 기후변화에 대응할 수 있는 과학적, 실용적인 예측 도구를 만드는 것입니다. 아울러, 이 탐구를 통해 기후변화의 근본 원인과 그 영향 요인을 다각도로 분석하고, 이를 토대로 정부나 관련 기관이 보다 효과적인 정책을 수립하는 데 기여할 수 있는 자료와 근거를 마련하고자 합니다. 이러한 연구 과정은 단순히 데이터 분석 모델을 구현하는 데 그치지 않고, 기후변화라는 글로벌 이슈에 대해 심도 깊게 고찰하고, 실제 문제 해결에 있어 과학적 접근의 중요성을 깨닫는 데에도 큰 의미가 있습니다.

 

2. 탐구의 범위와 방법

본 연구는 인공지능 공학 분야에 관심 있는 고등학생의 관점에서 진행되며, 주로 기후변화 예측 모델 제작에 착안하여 데이터 수집부터 모델 구성, 결과 분석 및 평가까지의 전 과정을 다룹니다. 연구 범위는 지난 10년간 기상자료 개방 포털에서 제공하는 일별 평균 온도 데이터를 기반으로 하며, 이 데이터를 전처리하고 정규화하여 LSTM 모델 학습에 적합한 형태로 가공하는 데 중점을 둡니다. 탐구 방법은 데이터 분석 및 시뮬레이션 방식을 채택하였으며, 이를 위해 파이썬 프로그래밍 언어와 텐서플로우(TensorFlow), 케라스(Keras) 라이브러리를 활용해 LSTM 모델을 구현하였습니다. 전체 과정은 데이터 수집, 전처리, 모델 설계, 모델 학습 및 튜닝, 그리고 최종 평가로 단계별로 나누어 진행되었으며, 모델의 예측 성능은 평균 절대 오차(MAE)와 평균 제곱 오차(MSE) 등 다양한 평가 지표를 활용하여 정량적, 정성적으로 분석하였습니다. 이와 함께, 연구 과정 중 발생한 여러 문제와 한계에 대해 심도 있는 논의를 진행하며, 향후 개선 가능한 부분과 추가 탐구의 방향도 함께 제시하고자 합니다. 이러한 체계적 접근은 고등학생의 수준에서 최신 인공지능 기법을 실제 문제에 적용해 보는 경험을 제공함과 동시에, 기후변화와 같은 복잡 다단한 문제를 이해하고 해결하는 학문적 소양을 기르는 데 크게 기여할 것입니다.

---

 

II. 이론적 배경

 

1. 핵심 개념 정의

기후변화 예측 연구의 핵심 개념은 크게 두 부분으로 나눌 수 있습니다. 첫째는 기후변화 및 지구 온난화의 개념으로, 이는 인간 활동으로 인한 온실가스 증가가 대기의 온도를 상승시키고, 이로 인해 지구 전체의 기후 패턴에 심각한 변화를 초래한다는 이론적 근거에 바탕을 두고 있습니다. 온실효과에 대해 간단히 설명하면, 지구 대기에 존재하는 이산화탄소, 메탄, 수증기 등의 온실가스는 태양 복사의 일부를 흡수하여 지구 표면의 온도를 높이게 됩니다. 이러한 온실효과는 자연적으로 존재하는 현상이지만, 인간의 산업화 이후 배출량이 급증하면서 기후 시스템에 과부하가 걸리게 되었습니다. 두번째 핵심 개념은 LSTM(Long Short-Term Memory) 네트워크입니다. LSTM은 순환 신경망(RNN)의 한 종류로, 긴 시계열 데이터를 학습하는 데 탁월한 특성을 가지고 있습니다. 전통적인 RNN은 장기 의존성 문제(long-term dependency problem)로 인해 시간이 지남에 따라 정보가 소실되는 단점이 있었으나, LSTM은 ‘셀 상태(cell state)’와 ‘게이트’ 메커니즘을 도입하여 과거 정보를 보다 오랜 기간 동안 유지하고 활용할 수 있게 했습니다. 이러한 특성 덕분에 LSTM은 기후 데이터와 같이 시계열적 특성이 뚜렷한 데이터의 예측 및 분석에 크게 기여할 수 있습니다. 이와 함께, 데이터 정규화, 결측치 처리 및 이상치 제거 등의 전처리 과정은 모델 학습의 정확도를 높이는 데 있어 필수적인 부분으로 인식되고 있습니다. 본 연구에서는 이러한 핵심 개념들을 기반으로 데이터 분석 및 모델 구현의 이론적 기초를 마련하며, 최신 인공지능 기법이 기후변화 예측 분야에서 가지는 잠재력을 심도 있게 다루고자 합니다.

 

2. 이전 탐구 검토

현재 기후변화 예측과 관련된 선행 연구는 전 세계적으로 활발하게 진행되고 있습니다. 특히, 인공지능 및 머신러닝 기법을 활용하여 기후 데이터를 분석하고 예측하는 시도는 이미 여러 학술 논문과 연구 보고서를 통해 그 효용성이 입증되었습니다. 예를 들어, 일부 연구에서는 CNN-LSTM과 같은 복합 신경망 구조를 사용하여 기후 패턴 변동을 예측하였으며, 이와 관련한 성능 개선 사례가 보고된 바 있습니다. 또한, 정부와 기상청 등 공공기관에서 제공하는 방대한 기상 데이터셋을 활용한 연구들이 다수 있으며, 이를 통해 기후 예측 모델의 신뢰도를 높이기 위한 다양한 데이터 전처리 및 하이퍼파라미터 튜닝 기법이 제시되고 있습니다. 국내외 학자들은 기후변화의 다양한 측면 – 예를 들어, 온도 변화, 강수량 패턴, 자연 재해 발생 빈도 등 – 을 종합적으로 분석하여 정책 수립 및 자연재해 예방에 기여할 수 있는 모델을 개발하고자 노력하고 있으며, 이와 관련된 문헌들은 Google Scholar, JSTOR 등의 데이터베이스를 통해 쉽게 접근할 수 있습니다. 본 연구에서는 이러한 선행 연구들을 바탕으로, LSTM 기반의 기후변화 예측 모델이 기존의 통계적 방법이나 단순 머신러닝 기법과 비교해 가지는 장점을 명확히 하고, 기후 데이터의 시계열적 특성을 효과적으로 반영할 수 있는 모델 아키텍처를 구성하고자 하였습니다. 이전 탐구 검토를 통해 얻은 다양한 접근법과 평가 지표들을 토대로, 본 연구에서는 특히 데이터 전처리의 중요성과 모델 성능 평가에 주목하며, 연구 과정에서 나타난 문제점과 개선점을 면밀히 분석하는 데 주력하였습니다. 이를 통해 본 연구는 기후예측 모델의 정확성을 높이고, 향후 기후변화 대응 정책의 수립 및 자연재해 예방에 기여할 수 있는 실질적 방안을 제안할 수 있을 것으로 기대됩니다.

 

III. 탐구 방법

 

1. 탐구 설계

본 탐구는 기후변화 예측을 위해 인공지능 LSTM 모델을 활용하는 것을 목적으로 합니다. 첫 단계에서는 기상자료 개방 포털을 통해 지난 10년간의 일별 평균 온도 데이터를 확보하고, 이를 기반으로 데이터 전처리, 학습, 평가의 순차적 과정을 진행합니다. 전체 탐구 과정는 크게 데이터 수집 및 전처리, 모델 설계와 구현, 모델 학습 및 튜닝, 그리고 평가 단계로 나눌 수 있습니다. 탐구 설계 단계에서는 우선 연구의 전체 흐름과 필요 기술들을 정리하고, 각 단계별 세부 절차를 수립하는 한편, 모델 성능 평가지표로 평균 절대 오차(MAE)와 평균 제곱 오차(MSE)를 선정하여 정량적인 분석을 수행할 계획입니다. 특히, 본 연구는 인공지능 기술 중에서도 순환 신경망 구조에 속하는 LSTM의 특성을 최대한 활용하여, 기후 데이터와 같이 시간에 따른 연속적 변화를 효과적으로 예측할 수 있는 모델을 구현하는 데 초점을 두고 있습니다. 이를 위해 모델 구성 시 입력층, 여러 개의 LSTM 층, 그리고 출력층을 포함하는 심층 신경망 아키텍처를 설계하고, 각 층의 노드 수와 활성화 함수를 세밀하게 조정하였습니다. 본 탐구 설계는 고등학생 수준의 이해를 바탕으로 최신 인공지능 기법을 적용한 모형을 직접 구현하고, 이를 통해 실제 기후 데이터에 대한 예측 성능을 검증해 보는 데 의의를 두고 있습니다.

 

2. 자료 수집

가. 데이터 수집 방법

기상자료 개방 포털에서 지난 10년간의 일별 평균 온도 데이터를 다운로드하여 연구에 활용하였습니다. 이 데이터는 기후변화의 장기적 패턴을 분석할 수 있도록 체계적으로 정리되어 있으며, 각 연도별, 월별, 일별로 구분되어 있어 시계열 분석에 적합합니다. 수집된 데이터는 다양한 환경 요소에 노출된 원시 데이터로, 결측치 및 이상치가 포함될 가능성이 크므로, 전처리 단계에서 이를 면밀히 검토하고 보정하는 작업이 필수적입니다. 데이터를 수집한 후, 먼저 데이터 정렬 및 결측치 처리 작업을 수행하였으며, 평균값 보간법 등 여러 기법을 적용하여 데이터의 신뢰성을 높였습니다. 또한, 각 데이터 항목에 대해 이상치 검출 알고리즘을 적용하여 비정상적인 값을 사전에 제거함으로써 분석 결과에 미치는 영향을 최소화하였습니다.

 

나. 표본 선정

표본 선정은 수집한 전체 데이터를 대상으로 하였으며, 탐구의 신뢰성을 확보하기 위해 데이터의 시간적 연속성과 대표성을 고려하였습니다. 주로 계절성 변화와 연간 온도 변동의 특징을 고려하여, 데이터의 분포와 패턴이 고르게 나타나는 구간을 중심으로 분석을 수행하였습니다. 이를 통해 표본의 대표성을 높이고, LSTM 모델의 학습 및 평가 과정에서 데이터 편향의 문제를 최소화할 수 있도록 하였습니다. 표본 선정 과정에서는 모든 데이터를 동일한 기준으로 분할하여 훈련 데이터(80%)와 테스트 데이터(20%)로 나누어, 모델이 미래 데이터를 예측하는 데에 있어 과거 데이터를 효과적으로 학습할 수 있도록 하였습니다.

 

3. 분석 방법

분석 방법은 크게 세 단계로 진행됩니다. 첫째, 수집된 데이터를 기반으로 결측치 처리, 이상치 제거 및 정규화 등의 전처리 과정을 거쳐 LSTM 모델 학습에 적합한 데이터셋을 구성합니다. 둘째, 전처리된 데이터를 바탕으로 LSTM 모델을 파이썬과 텐서플로우(또는 케라스)를 활용하여 구현하고, 각 층의 하이퍼파라미터(노드 수, 학습률, 배치 크기 등)를 조정하며 최적의 모델 아키텍처를 도출합니다. 셋째, 모델 학습 후 테스트 데이터를 통해 예측 성능을 평가하고, 평가 지표(평균 절대 오차, 평균 제곱 오차 등)를 산출하여 모델의 신뢰성을 검증합니다. 이와 함께, 예측 결과와 실제 온도 데이터를 시계열 그래프 및 마크다운 테이블 형태로 시각화하여, 모델이 기후변화 예측에 있어서 보여주는 성능을 직관적으로 파악할 수 있도록 하였습니다. 이러한 체계적인 분석 방법은 고등학생 수준에서 최신 인공지능 기법을 활용한 데이터 분석 및 예측 모델 구축의 전반적 과정을 경험할 수 있게 하며, 기후변화 예측 연구의 복잡한 문제들을 다각도에서 분석할 수 있는 기회를 제공하였습니다.

 

IV. 탐구 결과

 

1. 데이터 분석

본 탐구에서는 수집한 지난 10년간의 평균 온도 데이터를 기반으로, 데이터를 전처리한 후 LSTM 모델을 통해 미래 온도 변화를 예측하는 과정을 진행하였습니다. 우선, 데이터를 정규화한 후 훈련 데이터와 테스트 데이터로 분할하여, 모델 학습에 사용한 결과, 데이터 내에 존재하는 계절별 온도 변화와 연간 추세를 명확히 파악할 수 있었습니다. 모델은 학습 과정 동안 여러 차례의 에포크(epoch)를 거치며 내부 가중치를 조정하였고, 특히 학습률과 배치 크기 등 하이퍼파라미터의 튜닝을 통해 예측의 정확도를 극대화하였습니다. 학습이 완료된 후 테스트 데이터를 통한 예측 결과는 실제 온도 데이터와 높은 상관관계를 나타내었으며, 평균 절대 오차(MAE)와 평균 제곱 오차(MSE)의 값이 모두 낮게 도출됨으로써 모델의 예측력이 우수함을 확인할 수 있었습니다.

 

아래는 예시로 작성한 모델 예측 결과와 실제 데이터를 비교한 마크다운 테이블입니다:

 

날짜실제 온도 (°C)예측 온도 (°C)오차 (°C)

2023-06-01 25.3 25.1 0.2
2023-06-02 26.0 25.7 0.3
2023-06-03 24.8 24.9 0.1
2023-06-04 25.5 25.6 0.1
2023-06-05 26.2 26.0 0.2

 

모델 학습 과정에서는 실제 온도의 변화 패턴을 효과적으로 학습하였으며, 계절의 변화 및 단기적인 변동성을 모두 반영하는 예측 결과를 도출하였습니다. 이러한 분석 결과는 기후변화 예측에 있어 LSTM 기반 모델이 기존의 단순 통계 모델보다 뛰어난 성능을 보일 수 있음을 시사합니다. 데이터 전처리 과정에서 결측치 보완 및 이상치 제거의 중요성을 다시 한번 확인하였고, 이를 통해 모델 성능이 크게 개선됨을 확인할 수 있었습니다. 또한, 예측 결과의 시계열 분석 그래프를 통해 모델이 특정 기간 동안의 온도 상승 및 하강 패턴을 안정적으로 예측하여, 장기적인 기후변화 추세를 포착할 수 있음을 알 수 있었습니다. 이러한 정량적 분석과 함께, 정성적 분석 측면에서는 데이터의 변동성, 계절성 및 기후 이벤트(예: 폭염, 급격한 기온 하락 등)가 예측 모델에 미치는 영향을 종합적으로 고찰하였으며, 이를 바탕으로 향후 모델의 개선 방향을 모색할 수 있는 귀중한 통찰을 얻었습니다.

 

2. 주요 발견사항

가. 정량적 분석 결과

모델 평가 결과, 평균 절대 오차(MAE)와 평균 제곱 오차(MSE)의 값이 매우 낮게 나타났으며, 이로 인해 예측 값과 실제 온도 간의 오차가 미미함을 확인하였습니다. 특히, 에포크 수를 충분히 늘리고 하이퍼파라미터를 세밀하게 조정한 결과, 단기 및 장기 예측 모두에서 모델이 안정적인 성능을 보였습니다.

 

나. 정성적 분석 결과

정성적 분석에서는 기후 데이터의 계절성, 주기성 및 비정상적 급변 상황에 대해 모델이 효과적으로 반응하는 모습을 확인할 수 있었습니다. 이와 같은 결과는 기후변화에 대한 심도 있는 이해와 함께 자연재해 예방 및 정책 수립에 활용할 수 있는 근거 자료로서 중요한 의미를 지니게 됩니다.

 

V. 결론 및 제언

 

1. 탐구의 요약 및 시사점

본 탐구에서는 인공지능 LSTM 모델을 활용하여 지난 10년간의 평균 온도 데이터를 기반으로 기후변화 예측 모델을 구현하고 평가하였습니다. 연구 결과, LSTM 모델은 기후 데이터의 시계열적 특성을 효과적으로 학습하였으며, 평균 절대 오차(MAE)와 평균 제곱 오차(MSE) 등의 지표에서 낮은 오차 값을 기록함으로써, 실제 온도 변화와 높은 상관관계를 나타냈습니다. 이를 통해 본 연구는 미래 기후변화에 대해 보다 정밀한 예측을 가능하게 하는 모델의 잠재력을 확인할 수 있었으며, 나아가 정부 및 관련 기관의 기후변화 대응 정책 수립에 기여할 수 있다는 점에서 큰 시사점을 제공합니다. 또한, 본 탐구 과정에서 고등학생 수준에서 최신 인공지능 기법을 실제 문제에 적용하여, 기후와 환경 변화에 대한 심도 있는 이해와 더불어, 데이터 분석 및 모델링 기술의 중요성을 체감할 수 있었습니다. 특히, 기후변화 예측 모델의 구현은 단순 이론 학습을 넘어, 실생활 문제 해결에 직접적으로 기여할 수 있는 실질적 방안을 제시한다는 점에서 학문적 및 사회적 의의를 지니게 됩니다.

 

2. 탐구의 한계

본 연구는 데이터의 양과 범위, 그리고 모델 설계 및 하이퍼파라미터 튜닝 측면에서 몇 가지 한계를 가지고 있습니다. 첫째, 데이터 수집 범위가 지난 10년간의 평균 온도 데이터에 한정되어 있어, 다른 기후 변수(예: 강수량, 습도 등)의 영향을 반영하지 못한 점은 향후 연구에서 개선이 필요합니다. 둘째, 고등학생 수준의 연구 환경과 제한된 컴퓨팅 자원으로 인해, 보다 복잡한 심층 학습 모델이나 다양한 기법의 병행 적용에 제약이 있었습니다. 마지막으로, 모델의 예측 결과를 평가하는 데 사용된 지표가 제한적이었던 점 역시 한계로 작용하였으며, 더 다양한 성능 평가 방법 및 크로스 밸리데이션 등의 기법을 적용할 필요가 있습니다.

 

3. 후속 탐구 제안

앞으로의 연구에서는 기온 외에도 강수량, 습도, 기압 등 다양한 기후 변수들을 포함한 다변량 시계열 데이터를 활용하여, 보다 종합적인 기후변화 예측 모델을 개발하는 것이 필요합니다. 또한, LSTM 외에도 Transformer, GRU 등 최신 인공지능 모델을 비교 분석하여, 각각의 모델이 기후 데이터 예측에 미치는 효과를 심도 있게 평가할 것이 권장됩니다. 마지막으로, 본 연구 결과를 기반으로 정부 정책 수립, 자연재해 예방 및 농업, 에너지 관리 등의 분야에 실제 적용 가능한 확장 가능성을 모색하는 후속 연구가 진행된다면, 학문적 발전은 물론 사회 전반의 지속 가능한 발전에도 큰 기여를 할 수 있을 것으로 판단됩니다.

 

참고문헌

 

- 유진호, 정다은, 한정민, 이현주, 이윤영, 손수진, 김원무, 국종성, 이종화, 오상명. (2024). 태평양도서국 기후예측서비스: Achievements and Lessons learned over the last 10 years. 한국기상학회 학술대회 논문집, pp. 26-26.

- 이상민, 현유경, 신범철, 지희숙, 이조한, 황승언, 부경온. (2024). 기후예측시스템(GloSea6) 열대저기압 예측성능 평가. 한국기상학회 학술대회 논문집, pp. 225-225.

- 김지영, 지희숙, 현유경, 이조한, 부경온. (2024). 기상청 기후예측시스템(GloSea6) 예측장 검증 및 대기 고해상도 앙상블 시험생산. 한국기상학회 학술대회 논문집, pp. 242-242.

- 최봉석, 김화정. (2024). CNN_LSTM 딥러닝 모델 추론을 통한 베어링 수명 예측 대시보드 서비스. 한국방송미디어공학회 학술발표대회 논문집, pp. 287-290.

- Chriv Sokun Tepy, Unse Fatima, Junbom Pyo, Moongu Jeon. (2024). Enhancing Image Captioning with CLIP and LSTM: A Sequential Approach to Visual Descriptions. 한국정보과학회 학술발표논문집, pp. 704-706.

- 신유정, 박태현, 이가현, 이상욱, 송수근, 이현빈. (2024). AlphaPose와 LSTM을 이용한 작업자 인공수정 행동 인식. 한국정보과학회 학술발표논문집, pp. 1627-1628.

- Phone Myat Min, Brian E. Arfeto, Shehbaz Tariq, Hyundong Shin. (2024). Quantum-Augmented LSTM Networks for Stock Price Forecasting. 한국통신학회 학술대회논문집, pp. 221-222.

============

일단 AI를 이용해서 기본적인 보고서를 만들어 보았는데요~

이렇게 만들어진 보고서를 자신에 맞게 작성을 해 주어야 할 것 같습니다.

 

물론 선배가 이런 형식으로 활동을 하지는 않았을것 같네요.

예시를 들어 보기 위해 간단한 모델을 작성해 보았는데요~ 

이 데이터는 1990년 부터 2000년까지 10년간의 데이터를 일 평균으로 평균으로 만든 자료이다 보니 현재 시점의 온도를 예측하는데에는 문제가 있습니다.

또한 이 데이터는 오히려 LSTM 보다는 회귀 모델이 더 잘 맞을것 같습니다.

하지만 기후 예측은 시계열 데이터로 LSTM으로 하는것이 맞다고 판단되어 간단한 예제를 LSTM을 이용하여 프로젝트를 수행해 보았습니다.

이렇게 프로젝트를 수행하면서 다양한 문제점을 깨닫고 더욱 확장하면서 심도있게 공부한다면 생활기록부를 풍성하게 만들어 줄 수 있겠네요.

 

오늘도 최선을 다해 노력하는 학생들에게 응원의 박수를 보냅니다.

사업자 정보 표시
원당컴퓨터학원 | 기희경 | 인천 서구 당하동 1028-2 장원프라자 502호 | 사업자 등록번호 : 301-96-83080 | TEL : 032-565-5497 | Mail : icon001@naver.com | 통신판매신고번호 : 호 | 사이버몰의 이용약관 바로가기