OpenAI가 갑자기"작은 모델"GPT-4o mini를 오픈한 데 이어 Meta는 초대형 매개변수의 큰 모델 폭발장을 던지기로 결정했다.
7월 24일, Meta는 오픈 소스 대형 모델 시리즈 Llama 3.1 405B와 업그레이드된 70B와 8B 두 치수 모델을 발표했다.
Llama 3.1 405B는 현재 가장 강력한 오픈 소스 모델로 간주됩니다.메타가 발표한 정보에 따르면, 이 모델의 컨텍스트 길이는 128K를 지원하며, 8개 언어에 대한 지원을 추가하여 범용 지식, 조종 가능성, 수학, 도구 사용 및 다국어 번역 등에서 GPT-4o와 Claude ...
阅读全文