アリババはノートパソコン上で直接動作し、OpenAIの同等モデルを凌駕するQwen 3.5というコンパクトなモデルを開始します
Alibaba Qwen 3.5 — 新しいコンパクトAIモデルシリーズ
人工知能部門で、AlibabaはQwen 3.5ラインのリリースを発表しました。これらは「小型 + 高効率」を約束し、米国製同等品と比べてメモリ使用量が少なくても精度が高いです。
| モデル | サイズ | 主な特徴 |
|---|---|---|
| Qwen 3.5‑0.8B | 0.8 billion パラメータ | 「ミニチュア」かつ「高速」。プロトタイプやバッテリー制限のあるモバイルデバイス向け |
| Qwen 3.5‑2B | 2 billion パラメータ | 0.8Bと同様だが、若干パワーアップ |
| Qwen 3.5‑4B | 4 billion パラメータ | マルチモーダル、コンテキストウィンドウ262,144トークン。軽量エージェントソリューションに適合 |
| Qwen 3.5‑9B | 9 billion パラメータ | 推論が可能で、OpenAI gpt‑oss‑120B(13.5倍のパラメータ)を上回り、ロジカル思考で大学院レベルに達する |
すべてのモデルはApache 2.0ライセンス下で提供され、商用プロジェクトで使用したり必要に応じて再学習が可能です。
アーキテクチャの新点
Alibabaは従来型Transformerを放棄し、ハイブリッド構成を採用しました:
- Gated Delta Networks (GDN) – 高スループットと低遅延を実現
- Mixture‑of‑Experts (MoE) – 小規模モデルにありがちなメモリ制限問題を解決
この結果、Qwen 3.5はマルチモーダルトークンを即座に処理でき、以前の世代が行っていた画像生成器の「付随」方式を排除。4Bと9BバージョンはUI要素の認識やビデオ内オブジェクトカウントも可能です。
テストと結果
| ベンチマーク | Qwen 3.5‑9B |
|---|---|
| MMMU‑Pro(視覚) | 70.1 %(Google Gemini 2.5 Flash‑Lite 59.7、Qwen 3‑VL‑30B‑A3B 63.0を上回る) |
| ロジカル思考 | 81.7 %(OpenAI gpt‑oss‑120B 80.1より高いが、後者は10倍パラメータ) |
| HMMT Feb 2025(数学) | 83.2 %(9B)、74.0 %(4B)— 複雑な科学課題に大規模クラウドリソース不要を証明 |
| OmniDocBench v1.58 | 87.7 %(全モデル中トップ) |
| MMMLU(多言語) | 81.2 %(gpt‑oss‑120B 78.2より上位) |
なぜ重要か
Qwen 3.5の登場は、自治型AIエージェント需要の増加と同期しています。現代ユーザーはチャットボットだけでなく:
1. 思考 – 問題を推論する
2. 視覚 – 画像・動画・UI要素を処理する
3. 行動 – フォーム入力やファイル整理などツールを使う
大規模モデル(数十億パラメータ)は運用コストが高いため、Qwen 3.5はより経済的です。ローカルでクラウド接続なしに実行でき、強化学習で「人間らしい意思決定」を取れるようになります。
実務応用
- モバイルデバイス – 0.8Bはスマートフォンに収まり、自律運用が可能
- ワークステーション – 9Bはクラウド不要で完全なエージェント機能を提供
- インターフェース代理店 – ピクセルレベルの「バインディング」によりUI上を移動し、フォーム入力やファイル整理を自然言語で約90 %精度で実行
Alibaba Qwen 3.5は、クラウドとローカル両方で稼働できる、よりアクセスしやすく柔軟かつ強力なAIエージェントへの道を開きます。
コメント (0)
感想を共有してください。礼儀正しく、話題に沿ってお願いします。
コメントするにはログイン