QbitAI量子位

文章数:10350 被阅读:146647018

datasheet推荐 换一换
随便看看
账号入驻

不敢对比阿里Qwen2.5,Mistral“最强小模型”陷争议,欧洲的OpenAI也不Open了

最新更新时间:2024-10-17
    阅读数:
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

欧洲的OpenAI,也不Open了。

Mistral AI 发布自称“世界上最好的边缘模型”,却陷入质疑和争议。

不仅因为这一次没有磁力链接开放模型权重,也因为声称“始终优于同行”,但竞品对比并不全面。

官方账号和CEO的评论区中,有网友不留情面的指出问题: 怎么不和Qwen2.5对比呢?

Mistral AI这次最新发布两款模型, Ministral 3B/8B ,用于端侧和边缘计算。

公告中声称,两款模型在10B以下规模的知识、常识、推理、函数调用和效率方面推进了新的前沿。

展示的基准测试则使用内部框架重新评估所有模型,并声称在多项任务中“始终优于同行”。

但在具体评测结果中,只对比了自家初代Mistral模型、谷歌的Gemma和Meta的Llama系列。

缺失的Qwen2.5系列在9月19日发布,官方评测结果中对比对象同样包含Mistral 7B、Llama 3和Gemma 2。

尽管不是严格同样条件下的对比,在很多开发者看来相对数据也有参考价值。

StabilityAI前CEO Emad Mostaque 初步体验后也 表示,认为Qwen2.5感觉上更好,开源许可也更宽松,推荐更多人尝试Qwen2.5。

端侧小模型竞争激烈

Ministral 3B/8B两款模型都支持128k上下文长度,Ministral 8B具有特殊的交错滑动窗口注意力,可实现更快且节省内存的推理。

除此之外,目前没有透露更多技术细节。

两款模型从今天开始在官方平台提供API调用, 需要联系官方获得商业许可

另外 8B模型权重仅供研究使用 ,3B模型权重目前并未开放。

对此,Django框架创始人 Simon Willison 发文表示,在拥有更宽松开源许可且质量很高的Llama系列情况下,很难对Mistral新模型感到兴奋。

值得注意的是,Qwen2.5-7B虽然是宽松的Apache 2.0开源许可,但3B模型与Mistral一样选择了研究用许可。

从中也可以看出,能在手机等设备跑的端侧小模型中,目前真正实用的3B规模商业化落地正在加速,AI公司之间的竞争也越来越激烈。

欧洲的OpenAI变味了

Mistral AI发布端侧小模型的这一天,也是他们首款模型Mistral 7B的一周年附近。

官方还制作了忍者神龟梗图,展示其品线已经在一年之内迅速完善起来。

一年前,Mistral AI以先丢出神秘磁力链接、开放模型权重,几天后再发技术报告的独特作风,成为开源社区新宠。

但如今,这家“欧洲的OpenAI”也渐渐不Open了。

在2024年初,Mistral AI宣布与微软合作,同期推出的Mistral Large大模型不再开放权重,并 悄悄撤回了官方网站上有关开源社区义务的内容

这一举动被视为公司战略的重大转变,引起一波议论。

一些开源社区成员对此表示失望,认为这种先通过免费或低成本的产品吸引用户,然后通过高级功能收费的方式,是一种“背叛”。

最近一次Mistral AI甩磁力链接开放权重的模型,是他们首款多模态大模型Pixtral。

有观点认为这是由于他们刚进入多模态这一赛道,之后商业模式成熟了也会渐渐转向非开源。

有网友表示,随着大模型商业竞争加剧,未来Mistral AI走向开源的对立面是不可避免的,令人难过。

尽管如此,他们仍然赢得了许多善意,所以我还在为他们加油。

参考链接:
[1]
https://mistral.ai/news/ministraux/
[2] https://x.com/arthurmensch/status/1846565876046201289
[3] https://simonwillison.net/2024/Oct/16/un-ministral-des-ministraux/

评选征集中

「2024人工智能年度评选」

量子位2024人工智能年度评选已开启报名通道,评选从 企业 人物 产品 三大维度设立了5类奖项。

欢迎扫码报名评选! 评选结果将于12月 MEET2025智能未来大会 公布,期待与数百万从业者共同见证荣誉时刻。

点这里 ???? 关注我,记得标星哦~

一键三连「点赞」、「分享」和「在看」

科技前沿进展日日相见 ~



最新有关QbitAI量子位的文章

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: TI培训

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved