머신러닝 기반 건물 에너지 소비량 예측 및 영향 요인 분석 Machine Learning-Based Prediction of Building Energy Consumption and Influential Factor Analysis 차주호† Jooho Cha† 요 약 본 연구는 건물의 에너지 소비 효율성 증대 및 최적 관리를 목표로 머신러닝 기술을 활용한 전기 에너지 소비량 예측 모델을 개발하고, 소비에 영향을 미치는 주요 요인을 분석한다. 이를 위해 Kaggle에서 제공된 건물 에너지 소비량 데이터를 기반으로 시간적 특성을 반영한 피처 엔지니어링과 데이터 정제 과정을 수행했다. 모델의 예측 성능을 높이기 위해 4개의 개별 머신러닝 모델(Ridge, Random Forest, XGBoost, LightGBM)과 이들의 강점을 결합한 스태킹 앙상블(Stacking Ensemble) 모델을 구축했다. 특히, LightGBM과 XGBoost 모델은 베이지안 최적화 프레임워크인 Optuna 내에서 교차 검증을 수행하는 튜닝 기법을 적용하여 잠재적 성능을 향상시켰다. 성능 평가 결과, 개별 모델들의 예측 결과를 종합하여 최종 예측을 수행하는 스태킹 앙상블 모델이 R2 score 0.613, RMSE 5.037로 가장 우수한 성능을 보였다. 이는 안정적인 선형 모델(Ridge)과 복잡한 비선형 패턴을 학습하는 부스팅 모델(LightGBM, XGBoost)의 시너지가 예측 정확도 향상에 기여했음을 나타낸다. 또한, 설명가능 인공지능(XAI) 기법인 SHAP 분석을 통해 온도(Temperature), 냉난방 사용여부(HVACUsage), 재실 인원(Occupancy) 등이 에너지 소비량에 가장 큰 영향을 미치는 핵심 요인임을 규명하였다. 본 연구에서 개발된 모델과 분석 결과는 건물의 에너지 효율을 최적화하고 관련 정책을 수립하는데 중요한 기초 자료로 활용될 수 있다. 주제어: 에너지 소비량 예측, 머신러닝, 스태킹 앙상블, LightGBM, 설명가능 인공지능, SHAP ABSTRACT This study aims to develop a machine learning-based electrical energy consumption prediction model and analyze the key influencing factors to enhance the energy efficiency and optimal management of buildings. Based on building energy consumption data provided by Kaggle, advanced feature engineering and data refinement processes were performed to reflect temporal characteristics. To maximize the predictive performance of the models, five individual machine learning models (Ridge, Random Forest, Decision Tree, XGBoost, LightGBM) and a Stacking Ensemble model that combines their strengths were constructed. In particular, the LightGBM and XGBoost models were fine-tuned using a sophisticated method of performing cross-validation within the Bayesian optimization framework, Optuna, to maximize their potential performance. The performance evaluation revealed that the Stacking Ensemble model, which integrates the predictions of the individual models, demonstrated the highest performance with an R2 score of 0.613 and an RMSE of 5.037. This suggests that the synergy between a stable linear model (Ridge) and boosting models (LightGBM, XGBoost) capable of learning complex non-linear patterns contributed to the improved prediction accuracy. Furthermore, through SHAP analysis, an XAI technique, Temperature, HVACUsae, Occupancy were identified as the key factors most significantly influencing energy consumption, The model and analysis results developed in this study can serve as crucial foundational data for optimizing building energy efficiency and establishing related policies. Keywords: Energy Consumption Prediction, Machine Learning, Stacking Ensemble, LightGBM, XAI, SHAP |
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나 그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며, 이를 위반시 정보통신망 이용 촉진 및 정보보호 등에 관한 법률에 의해 형사 처벌됨을 유념하시길 바랍니다.