マイクロソフトは、テキスト、音声、およびグラフィックの生成用に3つの新しい内部AIモデルをリリースしました
6
hardware
Microsoft AIは3つの新しいマルチモーダルモデルを発表しました
人工知能(AI)の分野での地位強化に向けた取り組みの一環として、Microsoft AI研究部門はテキスト・音声・画像を生成できる独自の3つのモデルのリリースを発表しました。この決定は、主要なAIラボとの競争への対応策となります。
| モデル | 目的 | 主な指標 |
|---|---|---|
| MAI‑Transcribe‑1 | 音声をテキストに変換 | 25言語、速度 2.5 × Azure Fast |
| MAI‑Voice‑1 | オーディオトラックを作成 | 秒間1分、音声設定 |
| MAI‑Image‑2 | テキストから画像を生成 |
プロジェクトは、高度なAIシステムの基礎研究を行うMAI Superintelligence部門のチームによって開発されました。2025年11月に執行役員ムスタファ・スレイマン(Mustafa Suleyman)がチームに加わりました。
経済的効率性
開発者はGoogleやOpenAIの同等モデルと比べて計算コストを削減することに特に注力しました:
| サービス | 価格 |
|---|---|
| テキスト解読 | $0.36/時間 |
| 音声合成 | 1 百万文字あたり$22 |
| 画像処理 | 入力トークン10万個あたり$5、出力トークン100万個あたり$33 |
モデルはすでにMicrosoft Foundryプラットフォームに展開されています。音声の転写と合成はMAI Playgroundで利用可能です。
OpenAIとのパートナーシップ
独自ソリューションの積極的な開発にもかかわらず、ムスタファ・スレイマンはOpenAIとの協力へのコミットメントを確認しました。Microsoftはすでに130億ドル以上を投資しており、長期契約に基づき製品でOpenAIモデルの使用を継続し、マイクロチップと同様の多角化戦略を採用しています。
このように、Microsoft AIは高速かつ経済的なマルチモーダルソリューションを提供しながら、主要パートナーとの緊密な関係を維持してAI市場での地位を強化しています
コメント (0)
感想を共有してください。礼儀正しく、話題に沿ってお願いします。
コメントするにはログイン