‘소형언어모델 강자’ 업스테이지, 차세대 LLM 프리뷰 뿌린다

솔라 프로…기존 대비 성능 강화
11월 공개 앞서 소형언어모델 1위
자체 LLM 제품군 대규모 업데이트

최지현 기자|2024/09/11 10:48
업스테이지가 '솔라 프로' 프리뷰 버전을 공개한다. /업스테이지
업스테이지가 '솔라' 기술력을 끌어올렸다. 솔라는 회사가 자체 개발한 사전학습 LLM(거대언어모델)이다. 최근 GPU(그래픽처리장치) 가격 급등과 수급난으로 골머리를 앓는 기업용 AI(인공지능) 시장의 판도를 크게 바꿀 것으로 기대를 모은다.

11일 업스테이지는 오는 11월 출시 예정인 차세대 LLM '솔라 프로'의 초기 테스트용 모델인 '솔라 프로 프리뷰' 버전을 오픈소스 및 무료 API를 통해 전면 공개한다고 밝혔다.

솔라 프로는 솔라 LLM 시리즈의 상위 모델이다. 업스테이지는 현재 개발 중인 모델을 미리 테스트해 볼 수 있는 프리뷰 버전을 오픈소스로 공개한다. API 호출 비용도 무상 지원할 예정이다. 프리뷰 버전은 영어만 지원하며, 입력 토큰 수이 4096자로 제한된다.
솔라 프로는 220억(22B) 매개변수를 갖춰 기존 '솔라 미니'(107억) 대비 두 배 이상 커지고 성능도 대폭 향상됐지만, DUS(깊이 확장 스케일) 기술 등 자체 LLM 모델링 방법론을 더욱 고도화한 결과 여전히 단 1개의 GPU에서 구동이 가능한 수준으로 경량화에 성공했다.

인문학 뿐만 아니라 과학·기술·공학·수학(STEM) 종합 지식을 평가하는 'MMLU Pro', 지시 이행 능력을 평가하는 'IFEval' 등 최신 LLM 벤치마크(성능 평가) 지표에서 솔라 미니보다 평균 51% 이상 대폭 향상됐다. 최신 지표인 MMLU Pro는 기존 대비 정답률을 낮추고, 학부생 수준 이상의 추론을 요구해 고난도로 정평이 높다.

이는 마이크로소프트의 '파이-3 미디엄', 메타 '라마 3.1 8B', 미스트랄AI-엔비디아 '네모 12B', 구글 '젬마 2 27B' 등 유사 사이즈의 빅테크 모델 성능을 모두 뛰어넘은 수치다. 매개변수가 3배 이상 큰 '라마 3.1 70B' 등 다중 GPU를 요구하는 모델과 유사한 수준이다.

특정 분야에 대한 전문성과 정확한 답변이 요구되는 기업용 AI 시장에서 벤치마크 고득점은 LLM의 실제 문제해결 능력을 가늠할 수 있는 중요한 척도로 작용한다. 솔라 프로가 문서·보고서 작성과 데이터 분석·관리 등 업무 영역 전반에서 고성능 AI를 구현할 수 있는 수준에 도달했다는 게 업스테이지 설명이다.

김성훈 업스테이지 대표는 "자체 기술로 개발한 세계 최고 수준의 LLM 솔라를 통해 글로벌 AI 시장에 도전장을 내민 업스테이지가 더욱 강력한 차기 모델을 야심 차게 준비하고 있다"며 "최소의 인프라 비용으로 업계 최강의 성능을 자랑하는 솔라 프로를 프리뷰 버전을 통해 많이 테스트해보기를 바란다"라고 말했다.