Semantic Scholar자연어·LLM서베이중요도 7arXiv.org
2년 전
대규모 언어 모델의 종합적 개요와 발전 방향
Large Language Models: A Survey
Shervin Minaee, Tomáš Mikolov, Narjes Nikzad, M. Chenaghlu, R. Socher, Xavier Amatriain, Jianfeng Gao
인용 975인기 27.5
AI 분석
한줄 요약
ChatGPT 이후 주목받는 LLM의 주요 계열과 기술, 데이터셋, 평가 방법을 종합적으로 정리한 서베이 논문.
풀어야 하는 문제
LLM 분야가 급속히 발전하면서 모델 종류, 학습 방법, 평가 기준이 다양해져 전체 그림을 파악하기 어려워졌다. 연구자와 실무자에게 체계적인 개요와 비교 분석이 필요하다.
접근 방법
GPT, LLaMA, PaLM 세 주요 LLM 계열을 중심으로 각 모델의 특징, 기여, 한계를 분석한다. 또한 LLM 구축 및 증강 기술(파인튜닝, 프롬프트 엔지니어링, RAG 등)을 개괄하고, 학습·파인튜닝·평가용 데이터셋과 평가 지표를 조사한다. 대표 벤치마크에서 여러 LLM의 성능을 비교한다.
결과·기여
LLM 연구의 현재 상태를 포괄적으로 정리하여 초심자와 전문가 모두에게 유용한 참고 자료를 제공한다. 각 모델의 장단점을 명확히 하고, 데이터셋과 평가 방법의 현황을 체계화했다. 향후 연구 방향(효율성, 신뢰성, 윤리 등)을 제시하여 후속 연구에 방향성을 준다.