通义千问 Qwen3-4B 新模型发布,端侧性能大跃升

2025-08-07 09:17:21 0

  8 月 7 日消息,昨日(8 月 6 日),通义千问 Qwen 发布公告,宣布推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 两个模型,实现了性能的大幅提升。

  官方指出,小型语言模型(SLM)在智能体人工智能(Agentic AI)的发展进程里具有极高价值。而 “2507” 版本的 Qwen3-4B 模型,具备体积小巧但性能强劲的特点,尤其适合在手机等端侧硬件上进行部署。

  根据相关博文介绍,在非推理(non-thinking)领域,Qwen3-4B-Instruct-2507 显著增强了通用能力,目标是成为更为全能的端侧得力工具。

  该模型掌握了更丰富的语言知识以及长尾知识,其上下文理解长度扩展到了 256K,即便作为小模型也能够处理长文本。在通用能力方面,该模型超越了闭源的小尺寸模型 GPT-4.1-nano,性能与同等规模的 Qwen3-30B-A3B(non-thinking)相近。

  官方表示,该模型更像是一位高效的 “执行专家”,能够严格遵循指令,迅速给出响应,在内容创作、工具调用等方面更为适用。

  在推理(thinking)领域,Qwen3-4B-Thinking-2507 的推理能力有了大幅提升,在 AIME25 测评中获得了高达 81.3 分的成绩。Qwen3-4B-Thinking-2507 的推理表现可与中等模型 Qwen3-30B-Thinking 相媲美,在聚焦数学能力的 AIME25 测评中,以仅 4B 的参数量取得了 81.3 分的优异成绩。

  官方称此模型如同一位严谨的 “学术专家”,面对复杂问题时能够逐步展开推理,完成任务的过程更加深入且可靠 。

消息来源:
朝闻通公众号
朝闻通传媒
朝闻通传媒
微信公众号“朝闻通”发布全球互联网、科技、媒体、通讯企业的经营动态、财报信息、企业并购消息。扫描二维码,立即订阅!
关键词: 新闻稿发布
企业新闻室 更多

谷歌 Gemini AI 推 “引导式学习”,助力教育并惠及多国学生

2025-08-07 09:27
0

大众调整产品线,途锐与 ID.5 停产在即

2025-08-07 09:26
0

苹果与三星合作,美国工厂将生产新一代芯片

2025-08-07 09:24
0

苹果 iOS 26 系统优化 AirPods 充电体验,指示灯与通知双升级

2025-08-07 09:20
0

苹果斥资 6000 亿美元推进美国制造计划,强化本土供应链布局

2025-08-07 09:18
0

通义千问 Qwen3-4B 新模型发布,端侧性能大跃升

2025-08-07 09:17
0
相关新闻

神州租车清明跨城出行需求显著上升,订单量同比增长416%

2025-04-11 05:10
0

2025淮安西游乐园淮安马拉松暨大运河马拉松系列赛(淮安站)发布会召开

2025-04-11 04:34
0

戴森发布全新沙龙级美发造型科技,进一步扩大产品矩阵

2025-04-11 04:11
0

官宣丨三思「超高亮」吸顶灯,开启健康光照新标杆

2025-04-10 02:47
0

「汽水音乐民谣派对」用和弦解冻整个城市 万人合唱定格春日旋律

2025-04-10 02:35
0

CITE 2025启幕在即:顶尖展商集结 见证巅峰时刻

2025-04-10 02:31
0
行业新闻

三星 Galaxy Buds3 FE 现身拉丁美洲官网,售价 129 美元

2025-08-07 09:35
0

谷歌正式推出 AI 编程工具 Jules,由 Gemini 驱动并集成 GitHub

2025-08-07 09:32
0

谷歌 Gemini AI 推 “引导式学习”,助力教育并惠及多国学生

2025-08-07 09:27
0

大众调整产品线,途锐与 ID.5 停产在即

2025-08-07 09:26
0

苹果与三星合作,美国工厂将生产新一代芯片

2025-08-07 09:24
0

苹果 iOS 26 系统优化 AirPods 充电体验,指示灯与通知双升级

2025-08-07 09:20
0
联系
客服
专属客服
扫码添加客服微信
服务热线
400-880-0046
18600423130