首页 报纸 正文

ポスター新聞記者の孫傑報道
5月21日、阿里雲は重量ポンドのニュースを投げ出した:通義千問GPT-4級主力モデルQwen-Long、API入力価格は0.02元/千tokensから0.0005元/千tokensに下がり、97%下落した。これは、1元で200万tokensを買うことができ、「新華字典」5冊の文字量に相当することを意味している。このモデルは最大1千万tokensの長いテキスト入力をサポートし、値下げ後はGPT-4価格の約1/400となり、世界的な底値を打ち破った。
Qwen-Longは通義千問の長いテキスト拡張版モデルで、性能対標GPT-4、文脈長は最高1千万に達した。入力価格が0.0005元/千tokensに下がったほか、Qwen-Long出力価格も90%から0.002元/千tokensに下がった。対照的に、国内外のメーカーGPT-4、Gemini 1.5 Pro、Claude 3 Sonnet、Ernie-4.0の1000 tokens当たりの入力価格はそれぞれ0.22元、0.025元、0.022元、0.12元で、いずれもQwen-longをはるかに上回っている。
通義千問の今回の値下げは9種類の商業化とオープンソースシリーズのモデルをカバーしている。先ごろ発表された通義千問旗艦モデルQwen-Maxは、API入力価格を0.04元/千tokensに下げ、67%の下げ幅となった。Qwen-Maxは現在業界で最も優れた中国語の大モデルであり、権威あるベンチマークOpenCompassでGPT-4-Turboと性能が追いつき、大模型競技場Chatbotアリーナで世界トップ15にランクインした。
先日、OpenAIのSam AltmanはChatbotアリーナランキングを転送してGPT-4 oの能力を証明した。その中で、世界ランキング上位20モデルのうち、3モデルだけが通義千問出品だった。
業界では、大モデルの性能が徐々に向上するにつれて、AI応用革新は密集探索期に入っているが、推理コストが高すぎることは依然として大モデルの規模化応用を制約する重要な要素であると考えられている。
武漢AIリーダーサミットの現場で、阿里雲知能集団のベテラン副総裁で公共クラウド事業部の劉偉光総裁は、「中国第1位のクラウドコンピューティング会社として、阿里雲が今回大きなモデルの推理価格を大幅に引き下げたのは、AI応用の爆発を加速させたいということだ。将来的には、大モデルAPIの呼び出し量が何千何万倍も増加すると予想される」と述べた。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

joanne941 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    0