본문 바로가기
Tech

유럽의 오픈 AI라 불리우는 미스트랄 AI의 모든 것

by 생각소년 2023. 12. 14.

안녕하세요. 생각소년입니다.

인공지능 (AI) 분야에서 가장 주목받는 기술 중 하나는 대형언어모델 (LLM)입니다. LLM은 매우 큰 규모의 텍스트 데이터를 학습하여 자연어를 이해하고 생성할 수 있는 AI 모델입니다.

 

LLM은 다양한 언어 작업에 활용될 수 있으며, 챗봇, 번역, 요약, 작문, 코딩 등에 응용할 수 있습니다. LLM의 대표적인 예로는 오픈 AI의 GPT 시리즈, 메타의 라마 시리즈, 구글의 BERT 시리즈 등이 있습니다. 이들 모델은 매개변수 수가 수십억에서 수천억에 이르는 거대한 모델로, 인간의 언어 능력을 뛰어넘는 성능을 보여주고 있습니다.

 

하지만 이들 모델은 대부분 폐쇄형으로, 일반 사용자들이 접근하기 어렵습니다. 또한, 저작권 문제로 인해 공개된 데이터만으로 학습한 모델은 성능이 떨어지는 경우가 많습니다.

 

이러한 문제를 해결하고자, 프랑스의 신생 스타트업 미스트랄 AI가 오픈 소스 LLM을 개발하고 있습니다.

 

미스트랄 AI는 구글 딥마인드와 메타의 연구원 출신들이 공동 설립한 회사로, 영어 작업과 코딩 기능을 갖춘 LLM을 오픈 소스로 제공하고 있습니다. 미스트랄 AI의 목표는 유럽의 오픈 AI가 되는 것입니다.

 

미스트랄AI 로고

 

미스트랄 AI의 역사와 비전

미스트랄 AI는 2023년 5월에 설립된 신생 스타트업입니다. 구글의 인공지능 자회사 딥마인드와 메타의 연구원 출신인 티모세 라크루아, 굴럼 랑플, 아서 멘슈 등 세 명의 공동 창업자가 이끌고 있습니다.

 

미스트랄 AI의 비전은 인공지능의 민주화와 공유를 위해 오픈 소스의 LLM을 개발하고 배포하는 것입니다. 미스트랄 AI는 프랑스 정부와 유럽연합 (EU)의 지원을 받으며, 유럽의 AI 생태계를 선도하고 있습니다.

 

미스트랄 AI의 기술과 성과

미스트랄 AI는 공개적으로 사용 가능한 데이터셋과 기업이 제공한 데이터로만 학습한 LLM을 개발하고 있습니다. 이렇게 하면 저작권 문제를 해결할 수 있습니다.

 

미스트랄 AI는 2023년 9월에 매개변수 73억 개의 기업용 소규모 LLM인 '미스트랄 7B’를 오픈 소스로 출시했습니다. 미스트랄 7B는 영어 작업과 코딩 기능을 갖췄으며, 미세조정이 쉬운 것이 특징입니다. 미스트랄 7B는 최근 각종 벤치마크에서 기존 오픈 AI의 ‘GPT-4’, 앤트로픽의 ‘클로드’ 등 현존 최고의 폐쇄형 LLM의 성능을 거의 따라잡았으며, 메타의 '라마 2’와 같은 오픈 소스의 성능을 능가하는 것으로 알려졌습니다.

 

미스트랄 7B는 Hugging Face 리더보드에서 다른 모델들을 압도하며, GLUE, SuperGLUE, SQuAD, WikiSQL 등의 영어 작업에서 1위를 차지했습니다. 또한, 오픈 Ko-LLM 리더보드에서는 라마 2 13B를 제치고, 한국어 작업에서도 1위를 달성했습니다. 미스트랄 7B는 또한, 코드 생성, 이미지 생성, 번역 등의 다양한 작업에서도 우수한 성능을 보여주었습니다.

 

미스트랄 AI의 투자 현황

미스트랄 AI는 설립 6개월 만에 기업 가치 10억 달러 이상인 ‘유니콘 기업’ 등극을 눈앞에 두고 있습니다. 미스트랄 AI는 2023년 12월에 20억 달러의 기업 가치로 4억 8700만 달러 규모의 투자 협상을 진행하고 있다고 보도되었습니다.

 

이번 투자는 벤처 캐피털 앤드리슨 호로비츠의 주도로 진행 중이며, 엔비디아와 세일즈포스가 1억 2000만 유로 규모의 투자에 참여하는 것으로 알려졌습니다. 이전에는 2023년 6월에 1억 1300만 달러의 시드 펀딩에 성공했습니다. 미스트랄 AI의 기업 가치는 반년 만에 10배가량 늘어난 것입니다.

 

미스트랄 AI의 미래 계획

미스트랄 AI는 미스트랄 7B보다 더 크고 강력한 LLM을 개발할 계획입니다. 미스트랄 AI는 내년에 매개변수 1조 개의 대규모 LLM인 '미스트랄 1T’를 상업용으로 출시할 예정입니다. 미스트랄 1T는 미스트랄 7B의 후속작으로, 전문가의 혼합 아키텍처를 사용하여 더 높은 성능과 다양한 기능을 제공할 것입니다.

 

미스트랄 1T는 미스트랄 7B와 마찬가지로 오픈 소스로 제공될 예정이며, 다국어 및 다모달 작업을 지원할 것입니다. 미스트랄 AI는 미스트랄 1T를 통해 인공지능의 민주화와 공유를 실현하고, 유럽의 AI 리더십을 강화하고자 합니다.

댓글