アリババ、バイトダンス、クアイショウはロボット工学から映画用ビデオコンテンツ生成まで、新しいAIモデルを発表しました。
中国のIT巨人が新しいAIアルゴリズムを披露
コンテキスト
先週、米国の人工知能市場はAnthropicとAltruistのモデルの可能性について議論されていました。これらはプログラミングや金融サービスに影響を与えています。同時に、中国の技術大手であるAlibaba、ByteDance(TikTok所有者)、Kuaishouは独自のAIモデルを発表し、ロボット工学と動画生成における性能向上を示しました。これらの開発は、中国が西側の競合他社に遅れずについていることを確認しています。
背景
新しいアルゴリズムの発表は、Google DeepMind創設者Demis Hassabisが最近「中国のAIモデルは西側より数か月遅れている」と述べた後に来ました。しかし、今年紹介されたツールはOpenAI(Sora)、Nvidia、Googleの動画生成とロボット工学製品と直接競合することができます。
1. RynnBrain – Alibaba の「スマート」ロボティックアシスタント
* 何か?
Alibaba DAMO の研究部門は、ロボットが周囲の世界をよりよく認識し、オブジェクトと相互作用できるように設計された RynnBrain モデルを発表しました。
* デモンストレーション
動画では、手の代わりにクレシー(爪)を持つロボットがオレンジを収穫し、バスケットに入れる様子と、冷蔵庫から牛乳を取り出す様子が示されています。
* 技術的特徴
- 日常物体の認識には広範な学習が必要です。
- RynnBrain は時間と空間の意識を内蔵しており、ロボットはイベントが起こる場所と時刻を記憶し、タスクの進捗を追跡し、複数段階で作業を継続できます。
- これにより実環境での信頼性と一貫性が向上します。
* ポジショニング
Alibaba はロボット工学で Nvidia と Google に対抗する「基本的な知能レベル」を構築することを目指しています。
2. Seedance 2.0 – ByteDance の動画生成
* 機能
モデルは簡単なテキスト説明からリアルなビデオクリップを作成できます。また、既存の映像や画像を処理し、新しい構成に統合することも可能です。
* 利点
- 前バージョンと比べて管理性、速度、効率が向上しています。
- Hugging Face の研究者 Adina Yakefu は「モデルはそのバランスの良さで驚かせる」と評価し、初回起動時から高品質な結果を出すと述べています。
* 技術的詳細
Seedance 2.0 はビジュアライゼーション、音響サポート、およびオペレーター作業を一つのフローに統合し、実験プロトタイプではなく完成品を生成します。
* 問題と制限
- プライバシーの懸念から ByteDance はアップロードされた写真から人間の声を生成する機能を一時停止しました。
- この決定は、ブロガーが許可されていない音声合成に関して懸念を表明した後に下されました。
3. Kling 3.0 – Kuaishou の競合モデル
* 全体像
Kling 3.0 は動画生成用に設計され、Seedance 2.0 の直接的な対抗馬として位置付けられています。
* 主な改善点
- 一貫性の向上(詳細は本文で明示されていませんが、品質の大幅な向上が想定されています)。
結論
- 中国企業はロボット工学と動画生成のためにAIアルゴリズムを積極的に開発し、競争力あるソリューションを提示しています。
- Alibaba は時間と空間を意識した「スマート」ロボットに注力しています。
- ByteDance は高度なビデオコンテンツ生成モデルを提供しますが、音声合成の倫理問題に直面しています。
- Kuaishou は生成モデルポートフォリオを拡大し、ByteDance と競争しています。
これらの開発は、中国が西側のイノベーションを追随するだけでなく、自国のAI製品市場を積極的に形成していることを裏付けています
コメント (0)
感想を共有してください。礼儀正しく、話題に沿ってお願いします。
コメントするにはログイン