인공지능 연산량 감소 기법에 대한 리뷰 A Review of Computational Reduction Techniques in Artificial Intelligence 이주호† Chuho Yi† 요 약 인공지능 모델은 성능을 높이기 위해 층수와 채널 수를 계속 확장해 왔지만, 그 결과 계산량과 메모리 요구량이 폭증해 모바일 등의 엣지 기기나 핸드폰과 같은 개인 장비에서 실시간 서비스가 어려워지고 있다. 이 문제를 해결하는 방법들에 대해 본 논문에서는 두 가지 핵심 전략으로 구분하여 소개하고자 한다. 첫째, 모델 구조 설계 중심 접근 방법은 깊이별-그룹 합성곱, 복합 스케일링 등등의 구조 탐색을 통해 처음부터 연산 부담을 줄이는 방법을 소개한다. 둘째, 파라미터 변환 기반 접근 방법은 이미 학습된 모델을 대상으로 지식 증류, 정수 양자화, 가지치기 등등을 적용해 파라미터와 연산을 크게 줄이는 방법을 소개한다. 현장실무에서는 경량 백본을 만든 뒤 양자화와 증류로 정확도를 복구하는 파이프라인이 흔히 사용된다. 앞으로는 대형 멀티모달 모델과 친환경 인공지능시대에 대응하기 위해 아키텍처 탐색과 하드웨어, 소프트웨어의 통합 최적화가 필수 과제로 떠오를 전망이다. 주제어: 연산량 감소, 모델 구조 설계 효율화, 파라미터 변환, 정수 양자화, 지식 증류 ABSTRACT Deep‑learning models have continually increased their layer depth and channel width to boost performance, but this expansion has caused an explosive growth in computation and memory demand, making real‑time service on edge devices such as smartphones and other personal hardware increasingly difficult. To tackle this problem, the present paper distinguishes and introduces two core strategies. The first strategy, an architecture‑centric design approach, reduces the computational burden from the outset by exploring structures such as depthwise‑group convolutions and compound scaling. The second strategy, a parameter‑transformation approach, targets already‑trained networks and sharply cuts parameters and operations by applying knowledge distillation, integer quantization, pruning, and similar techniques. In the field, a common pipeline first builds a lightweight backbone and then recovers accuracy through a combination of quantization and distillation. Looking forward, architecture search and full hardware–software co‑optimization are expected to become essential tasks in order to cope with large multimodal models and to meet the demands of an eco‑friendly era of artificial intelligence. Keywords: Computational Reduction, Efficient Model Architecture Design, Parameter Transformation, Integer Quant ization, Knowledge Distillation |
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나 그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며, 이를 위반시 정보통신망 이용 촉진 및 정보보호 등에 관한 법률에 의해 형사 처벌됨을 유념하시길 바랍니다.