找到
5
篇与
综合板块
相关的结果
-
阿里开源新模型:性能对标DeepSeek-R1,参数仅为其1/20 3 月 6 日凌晨 3 点,阿里巴巴发布并开源全新的推理模型通义千问 QwQ-32B。阿里巴巴称,这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。 据悉,QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力,并与 OpenAI 的 o1-mini 以及 DeepSeek 满血版及蒸馏版进行了比较。 图片 在测试数学能力的 AIME24 评测集上,以及评估代码能力的 LiveCodeBench 中,千问 QwQ-32B 表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 蒸馏模型。 在由 Meta 首席科学家杨立昆领衔的“最难 LLMs 评测榜”LiveBench、谷歌等提出的指令遵循能力 IFEval 评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的 BFCL 测试中,千问 QwQ-32B 的得分均超越了 DeepSeek-R1。 官方介绍称,这一成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。此外,阿里团队还在推理模型中集成了与 Agent 相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。 除了性能上的大幅提升,QwQ-32B 的另外一个亮点是大幅降低了部署使用成本,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中。 资料显示,从 2023 年至今,阿里通义团队已开源 200 多款模型,包含大语言模型千问 Qwen 及视觉生成模型万相 Wan 等两大基模系列,覆盖从 0.5B 到 110B 等参数,实现了全模态、全尺寸大模型的开源。 开源社区 Hugging Face 此前的榜单显示,开源仅 6 天的阿里万相大模型已反超 DeepSeek-R1,登顶模型热榜、模型空间榜两大榜单,成为近期全球开源社区最受欢迎的大模型。根据最新数据,万相 2.1(Wan2.1)在 Hugging Face 及魔搭社区的总下载量已超百万,在 Github 的 Star 数超 6k。 在通义千问最新推理模型发布并开源后,阿里巴巴股价应声大涨。隔夜美股收盘涨 8.61%,报收 141.03 美元。截至发稿,阿里巴巴港股涨超 7%。今年以来,阿里巴巴股价累计涨幅已近 70%。 来源:界面新闻
-
小米澎湃 OS 突然增加这限制 网友直接炸了 图片本以为。 五级社区等级、地狱难度的限时答题、绑定账号需满 168 小时、最多支持解锁三台绑定设备、解锁后无法 OTA 升级… 就已经是小米,对 BootLoader 解锁限制的全部。 毕竟这一套组合拳下来,绝大部分不懂刷机的萌新小白,都能轻松筛掉。 图片 结果春节假期还没过完,机哥就又看到一条噩耗。图片 图片 图片没错,小米又双叒更新了 BootLoader 解锁申请说明。 文字很多,内容很长。 图片大伙不用仔细看完,简单来嗦,新增了两条限制。 1.解锁 BL 的全部流程都需要保持实名账号、设备一致。包括答题、报名、申请、绑定、解锁,以及后续使用已解锁的设备。 2.小米高考上岸之后,需要 14 天内完成绑定解锁操作。不然资格直接作废。 图片 这样一来,高价卖资格的贩子,估计会比以前少很多。 但对于真心想自己解锁小米设备来用的米粉,这下子也更难受了。 图片稍有不慎,辛辛苦苦考来的资格就原地木大。 图片 鹅且,即便是限制条件一大堆,考题难度依然还是《较高》。 图片对,专业开发者都不一定能过的那种“较高难度”。 就算答题通过,报名成功,后续也有审核不通过的概率。 普通用户,更是别想了。 图片 图片层层加码之下。 小米这操作,这会来看已经算是「软封禁」BL 解锁了。 未来小米或许不会像友商一样,把这道门彻底焊死,但大概率,还会继续增加限制。 毕竟 “睡一觉就烧主板了帮我换个新的吧” 这种事。 现在还在发生。图片 图片 图片现在还想解锁搞机的话,可能…… 只能找宝宝巴士难度的一加了吧。 一加:我的机会来了?! ↘↘↘
-
-
-