메타, 모델 속도 최대 3배 향상 연구 발표…다중 토큰 예측 적용 - 매일경제

글자크기 설정
가
가
가
가
TOP
댓글
추천 기사
글자크기 설정
가
가
가
가
페이스북 운영사 메타는 대규모 언어 모델(LLM)의 정확성과 속도를 개선할 수 있는 연구 결과를 발표했다. 메타는 새 연구를 통해 모델 속도를 최대 3배 빠르게 할 수 있다고 제시했다. 이번 연구는 아카이브에 실렸으며 에콜 데 퐁 파리테크, 파리 사클레 대학 등 프랑스 연구진과 함께 진행됐다.
연구의 핵심은 다중 토큰 예측 기법이다. 전통적인 자동회귀 언어 모델이 한 번에 한 토큰씩 예측하는 것과 달리, 여러 토큰을 동시에 예측함으로써 모델 향상시킬 수 있는 방법이다. 연구진은 “다중 토큰 예측이 모든 유형의 모델 및 언어 작업에 보편적인 솔루션은 아니지만, 생성 작업에서 3배 빠른 속도와 더 나은 성능을 제공하는 등 일부 영역에서 상당한 이점을 제공한다”고 말했다.
트랜스포머 아키텍처를 기반으로 한 멀티 토큰 예측 모델은 기존의 구조를 사용하되, 단일 출력 대신 여러 독립적인 출력 헤드를 통해 여러 토큰을 동시에 예측하는 것이 특징이다. 추론 과정에서는 기본적인 다음 토큰 예측을 유지하면서, 추가적인 출력 헤드를 사용해 디코딩 속도를 빠르게 할 수 있다. 이를 통해 실행 시간을 최대 세 배까지 단축시킨다.
특히, 바이트 수준에서 토큰화를 진행하는 실험에서는 멀티 토큰 예측이 기존 모델을 크게 앞서는 결과를 나타냈다. 이는 사전에 정의된 어휘 없이 작은 정보 조각을 사용해야 하는 애플리케이션에 특히 중요하다는 평가다. 연구 결과에 따르면, 큰 모델일수록 다중 토큰 예측의 효과가 증가하는 것으로 나타났다. 예측하는 토큰의 수가 많을수록 모델의 성능이 향상된다는 뜻이다.
연구진은 “이와 같은 멀티 토큰 예측 기술은 추가 비용 없이도 기존 모델보다 더 강력하고 빠른 트랜스포머 모델을 훈련시킬 수 있는 효과적인 방법”이라며 “앞으로 이 기술의 다양한 응용 가능성을 탐구할 계획”이라고 덧붙였다.
이 기사가 마음에 들었다면, 좋아요를 눌러주세요.
2024-05-10 12:29 기준
2024-05-08 10:21:42
2024-05-09 18:34:37
2024-05-09 10:16:44
2024-05-09 20:04:33
2024-05-09 06:20:04
2024-05-09 13:55:15
2024-05-09 11:11:37
2024-05-08 20:35:54
2024-05-09 09:47:50
2024-05-08 18:00:44

source

실시간뉴스!

‘하이브’ 방시혁, 대기업 총수 주식재산 6위 – 경향신문 5월 20, 2024

에코마케팅, 싱가포르서 팝업스토어… 일 매출 5만 달러 – Brand Brief – 브랜드브리프 5월 20, 2024

전북 완주군 삼례동초등학교, 기후위기 대응 체험환경교육 진행…환경생태교육 모범으로 평가 – 폴리뉴스 5월 20, 2024

아름다운 자연부터 감성 있는 예술이 가득한 파주 여행 – 대한민국정책포털 korea.kr 5월 20, 2024

아키드로우, '신세계까사'에 3D 인테리어 솔루션 공급 – 한국건설신문 5월 20, 2024

“오늘부터 병원 갈때 신분증 꼭 챙기세요” – 동아일보 5월 20, 2024

2024년 5월 15일 오늘의 띠별 운세 – 한국경제 5월 20, 2024

호치민시 의류업계, 제품 밀반출 피해 속출…수출품 버젓이 내수유통 – 인사이드비나 5월 20, 2024

[오늘의 운세] 2024년 05월 15일 별자리 운세 – YTN 5월 20, 2024

이동건, '드라마 업계' 불황에 2억 대출…"제주서 카페창업" – 뉴시스 5월 20, 2024

이 글 공유하기!

페이스북

Twitter

링크드인

admin

osexykorea.xyz

메타, 모델 속도 최대 3배 향상 연구 발표…다중 토큰 예측 적용 – 매일경제

이 글 공유하기!

admin

Keep Reading

댓글

답글 남기기 응답 취소