
(주)아크릴이 성균관대학교 우홍욱 교수 연구팀과의 공동 연구로 두 편의 대형 언어 모델(LLM) 관련 논문을 NeurIPS 2024와 EMNLP 2024에 발표할 예정이라고 8일 밝혔다.
NeurIPS(Neural Information Processing Systems)와 EMNLP(Empirical Methods in Natural Language Processing)는 인공지능 및 자연어 처리 분야에서 최고 수준의 학술대회로, 매년 전 세계의 연구자들이 모여 최신 연구 성과를 공유하고 논의하는 권위 있는 학술 행사이다. 이번 논문 발표는 아크릴이 자사의 주력 상품인 ALLM (Acryl-LLM)을 기반으로 한 LLMOps 솔루션을 다양한 산업군에 적용하고, 상용화 가능성을 제시하는 성과로, LLM의 적용 가능성을 스마트 홈, 자율주행, 헬스케어 및 로봇 제어와 같은 여러 분야에서 입증한 중요한 연구로 평가받고 있다.
NeurIPS 2024에서 발표될 연구는 “Exploratory Retrieval-Augmented Planning for Continual Embodied Instruction Following”이라는 주제로, 변화하는 환경에서 지속적으로 명령을 수행해야 하는 물리적 에이전트의 성능을 높이기 위해 새로운 ExRAP(Exploratory Retrieval-Augmented Planning) 프레임워크를 제안했다.
이 연구는 기존의 단순 명령 기반 모델의 한계를 극복하고, LLM을 통해 에이전트가 환경을 탐색하고 그 맥락에 따라 명령을 효율적으로 재계획할 수 있는 기술을 제시하였다. 아래 그림은 ExRAP을 통해 공통된 명령을 동시에 수행함으로써 수행 시간을 단축하는 예시를 보여준다. ExRAP는 가정용 로봇과 자율주행 차량 등의 제어 시스템에서 환경 변화에 신속하게 대응하고, 안전한 의사결정을 수행할 수 있는 기술로, 아크릴이 미래 로봇 제어 시장 진출을 위한 기술적 기반을 확보하는 데 기여하였다.
EMNLP 2024에서 공개될 연구는 “LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensemble (COREN)”이라는 제목으로, LLM을 학습 보상 추정 도구로 활용하여 강화 학습 기반 에이전트의 학습 효율을 극대화하는 COREN 프레임워크를 소개한다. COREN은 LLM을 직접 에이전트로 사용하지 않고, 보상 추정의 정밀도를 높여 에이전트가 복잡한 환경에서 신속하게 학습하고 의사결정을 내릴 수 있도록 한다.
아래 그림은 COREN의 구조와 LLM을 이용하여 문맥적, 구조적, 시간적 일관성을 기반으로 보상 값을 추정하는 과정을 보여준다. 이러한 기술은 제조업, 헬스케어, 교육 등 다양한 산업군에서 사용되는 산업용 로봇이나 스마트 디바이스의 자율적 학습 성능을 크게 향상시킬 수 있다. 아크릴은 COREN 프레임워크를 통해 헬스케어 로봇의 자가 학습 및 자율 의사결정, 그리고 스마트 홈 환경에서 가전기기와의 상호작용을 최적화할 수 있는 기술적 진보를 달성했다.
아크릴의 주력 상품인 ALLM (Acryl-LLM)은 LLMOps를 기반으로 한 솔루션으로, LLM을 다양한 산업 환경에 손쉽게 통합하고 상용화할 수 있도록 지원하는 플랫폼이다. 이를 통해 RAG(Retrieval-Augmented Generation), 파인튜닝(Fine-tuning), LoRA(Low-Rank Adaptation) 등 다양한 기술을 활용하여 맞춤형 LLM 솔루션을 제공하며, 헬스케어, 스마트 홈, 자율주행 차량 및 교육 시스템과 같은 분야에서 높은 성과를 보이고 있다.