登顶全球最强开源模型:阿里宣布开源Qwen3
Aim_yuan
发表于 3 小时前
107
0
0
该模型采用国内首创的混合推理架构,参数量仅为DeepSeek-R1的1/3,成本大幅下降,在数学推理、代码生成等核心指标超越DeepSeek-R1及OpenAI开源模型,登顶全球最强开源大模型榜单。
Qwen3采用混合专家架构(MoE),总参数量235B,激活参数仅22B,其“快思考”与“慢思考”模式可根据需求动态分配算力,如秒级响应简单问题,多步骤处理复杂任务,显著降低推理成本。在数学(AIME25 81.5分)、代码(LiveCodeBench 70+分)、人类偏好对齐(ArenaHard 95.6分)等评测中,Qwen3均刷新纪录,部分指标甚至超越Grok3和OpenAI-o1。
阿里此次开源包含235B、30B MoE及0.6B-32B等8款模型,其中30B版本以3B激活量实现上代Qwen2.5-32B模型性能,32B稠密模型跨级超越Qwen2.5-72B。全系支持“思考预算”配置,适配手机(4B)、汽车(8B)、企业级(32B)等场景。结合Qwen-Agent框架及MCP(模型上下文)协议,开发者可低代码调用工具功能,加速智能体(AI Agent)应用落地。
据阿里2024年财报,截至2024年12月31日止9个月,云业务收入同比增长9%至879亿元,AI相关收入占比持续提升。Qwen3的开源将进一步增强阿里云对大模型企业的吸引力,推动其“模型即服务”(MaaS)生态扩张。
目前,通义系列模型全球下载量超3亿次,衍生模型超10万,已超越美国Llama成为全球第一开源模型。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。