マイクロソフトは、テキスト、音声、およびグラフィックの生成用に3つの新しい内部AIモデルをリリースしました

マイクロソフトは、テキスト、音声、およびグラフィックの生成用に3つの新しい内部AIモデルをリリースしました

6 hardware

Microsoft AIは3つの新しいマルチモーダルモデルを発表しました

人工知能(AI)の分野での地位強化に向けた取り組みの一環として、Microsoft AI研究部門はテキスト・音声・画像を生成できる独自の3つのモデルのリリースを発表しました。この決定は、主要なAIラボとの競争への対応策となります。

モデル目的主な指標
MAI‑Transcribe‑1音声をテキストに変換25言語、速度 2.5 × Azure Fast
MAI‑Voice‑1オーディオトラックを作成秒間1分、音声設定
MAI‑Image‑2テキストから画像を生成

プロジェクトは、高度なAIシステムの基礎研究を行うMAI Superintelligence部門のチームによって開発されました。2025年11月に執行役員ムスタファ・スレイマン(Mustafa Suleyman)がチームに加わりました。

経済的効率性
開発者はGoogleやOpenAIの同等モデルと比べて計算コストを削減することに特に注力しました:

サービス価格
テキスト解読$0.36/時間
音声合成1 百万文字あたり$22
画像処理入力トークン10万個あたり$5、出力トークン100万個あたり$33

モデルはすでにMicrosoft Foundryプラットフォームに展開されています。音声の転写と合成はMAI Playgroundで利用可能です。

OpenAIとのパートナーシップ
独自ソリューションの積極的な開発にもかかわらず、ムスタファ・スレイマンはOpenAIとの協力へのコミットメントを確認しました。Microsoftはすでに130億ドル以上を投資しており、長期契約に基づき製品でOpenAIモデルの使用を継続し、マイクロチップと同様の多角化戦略を採用しています。

このように、Microsoft AIは高速かつ経済的なマルチモーダルソリューションを提供しながら、主要パートナーとの緊密な関係を維持してAI市場での地位を強化しています

コメント (0)

感想を共有してください。礼儀正しく、話題に沿ってお願いします。

まだコメントはありません。コメントを残して、あなたの意見を共有してください!

コメントを残すにはログインしてください。

コメントするにはログイン