查看原文
其他

速递 | Mistral Large 2是对Meta和OpenAI最新模型的回击,结果不相上下!

Maxwell Zeff Z Potentials
2024-08-23

图片来源:Mistral AI

对于前沿的人工智能模型来说,雨过天晴。本周三,Mistral 发布了全新的旗舰模型 Large 2,并声称该模型在代码生成、数学和推理方面与 OpenAI 和 Meta 的最新前沿模型不相上下。

就在 Meta 发布其最新、最伟大的开源型号 Llama 3.1 405b 的前一天,Mistral Large 2 发布了。Mistral 表示,Large 2 提高了开放机型的性能和成本标准,并提供了大量基准测试数据来证明这一点。

在代码生成和数学性能方面,Large 2 似乎超过了 Llama 3.1 405B,而且只用了不到三分之一的参数:准确地说,是 1 230 亿。

Mistral 公司在一份新闻稿中说,训练的重点之一是尽量减少模型的幻觉问题。该公司称,Large 2 接受的训练使它的反应更具辨别力,当它不知道某些事情时,它会承认自己不知道,而不是编造一些看似合理的事情。

这家总部位于巴黎的人工智能初创公司最近在 B 轮融资中筹集了 6.4 亿美元,由 General Catalyst 领投,估值达 60 亿美元。虽然 Mistral 是人工智能领域的新进入者之一,但它正在迅速推出处于或接近前沿的人工智能模型。

不过,值得注意的是,Mistral 的模型与其他大多数模型一样,并不是传统意义上的开源代码--任何模型的商业应用都需要付费许可。虽然它比 GPT-4o 更开放,但世界上很少有人拥有实施如此大型模型的专业知识和基础设施(Llama 的模型也是如此)。(当然,Llama 的 4050 亿参数也是如此)。

Mistral Large 2 和 Meta 昨天发布的 Llama 3.1 中都缺少多模态功能。在多模态人工智能系统方面,OpenAI 遥遥领先于竞争对手,能够同时处理图像和文本,而这正是一些初创公司越来越希望构建的功能。

该模型有 128,000 个标记窗口,这意味着 Large 2 可以在一次提示中摄入大量数据(128,000 个标记大约相当于一本 300 页的书)。Mistral 的新模型还改进了多语言支持。Large 2 可以理解英语、法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语,以及 80 种编码语言。值得注意的是,Mistral 声称 Large 2 还能做出比领先的人工智能模型更简洁的回应,因为领先的人工智能模型有喋喋不休的倾向。

Mistral Large 2 可在 Google Vertex AI、Amazon Bedrock、Azure AI Studio 和 IBM watsonx.ai 上使用。您还可以在 Mistral 的 le Plateforme 上使用新模型,名称为 "mistral-large-2407",并在该公司的 ChatGPT 竞争对手 le Chat 上免费测试。

本文翻译自:https://techcrunch.com/2024/07/23/openai-backed-legaltech-startup-harvey-raises-100m/
编译:ChatGPT

-----------END-----------

🚀 我们正在招募新一期的实习生
🚀 我们正在寻找有创造力的00后创业者

关于Z Potentials
继续滑动看下一个
Z Potentials
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存