ジーニーとの出会いGenie 3 – 仮想世界を生成するAI

友人にメッセージを書くのと同じくらい簡単に、自分の世界を創造できることを想像してみてほしい。いくつかの文章で説明するだけで、島や古代都市や宇宙ステーションが目の前に現れる。そして何より素晴らしいのは、ただ眺めるだけでなく、街を歩き、雰囲気を感じ、オブジェクトとインタラクションできることだ。Genie 3はGoogle DeepMindの新モデルで、インタラクティブな3D仮想世界を数分で作成できる。Genie3については、この記事の後半で詳しく紹介する。

静止画や短いクリップを生成するイメージジェネレーターやビデオジェネレーターとは異なり、Genie 3はワールドモデルです。画像をレンダリングするのではなく、空間、動き、オブジェクトとの相互作用、行動の結果といった世界の論理をシミュレートする。ユーザーがテキストの説明を設定すると、システムがリアルタイムでナビゲートできるダイナミックなシーンを構築する。公式データによると、主要パラメータは24fps、720pの解像度で、(今のところ)数分間のシミュレーションをサポートしている。

これまでのワールドモデルは、長時間のインタラクションですぐに崩れてしまう実験室のデモのようなものだった。Genie 3は、シミュレーションを “見る “ことから “中に住む “ことへとシフトしている。この具体的なインタラクティビティこそが、エージェント・システムの新たな開発レベル、さらにはAI/AGIへの一歩について多くの人々に語らせるのである。

実際の仕組み

他のAIと同じように、ヒントを作成する:「海岸沿いの道路に嵐」、「日本のロックガーデン日本のロックガーデン“、”アイスランドの峡谷でのドローン飛行 “といったヒントを入力すると、システムがシーンを生成し、キー操作やその他のユーザーのアクションに反応する。さらに、「プロンプト可能なワールドイベント」があります。セッションの途中で、雨を降らせたり、照明を変えたり、オブジェクトやキャラクターを追加したりできます。

ゲーム以外で必要な理由

レベルの迅速なプロトタイピング、コンテンツ・シーケンスを構築することなくメカニズムをテストすること、ナビゲーションやカメラのユーザビリティ・テストなどだ。しかし、それだけでなく、その範囲はより広い。教育では、生徒がリスクやコストをかけずに、水面の波から溶岩の流れまで、さまざまな現象と相互作用できる生きた実験室を手に入れることができる。ロボット工学は、エージェント/ロボットのための無限のシミュレーターであり、物理的な世界に入る前に様々な条件で学習することができる。

別のAIの心の中のAI

楽しいのは、人間ではなくエージェントがこの世界に入り込むときだ。ディープマインドはすでに、独自のSIMAエージェントの実験を見せている。SIMAエージェントは目標(ある地点に到達する、オブジェクトを収集する)を受け取り、本格的な環境としてGenie 3と相互作用する。これは文字通り、「あるAIが別のAIの想像の世界で遊ぶ」ものであり、学習のための完璧なサンドボックスなのだ。

以前のモデルと比べて、このモデルはシーンの完全性をより長く維持し、水や光のマテリアルに対してより自然に振る舞い、アクションに対してより適切に反応します。ユーザーにとって、これは実験、テスト、デモが30秒のクリップでなくなり、本格的なショートセッションに変わることを意味します。

しかし、まだ限界はある。

開発者は、テキストが常に読めるわけではないこと、私たちの世界の正確な位置を模倣することは可能性の範囲を超えていること、インタラクションの時間は数時間ではなく数分であることを直接認めている。エージェントが実行できるアクションの範囲も制限されている。これらの注意点は重要である。プロトタイプは問題ないが、実際の製品については、まだ解決する必要がある。いずれにせよ、Genieの将来のバージョンはすぐにリリースされ、これらすべてが修正/改善されるでしょう。

本日、Genie 3は、フィードバックを収集し、セキュリティプロトコルを調整するために、限られた数の研究者やクリエイターにリサーチプレビュー形式で公開されました。拡張アクセスは、チームがすべてのニュアンスを修正し、リリースできることを100%確信したときに、徐々にすべての人に提供される予定です。

リアルタイム世界生成は、ジェネレーティブAIの単なる機能のひとつではなく、デジタル環境と対話するためのまったく新しい言語である。Genie 3は、この言語がすでに手の届くところにあることを示している。

Натисніть, щоб оцінити цю публікацію!
[Всього: 0 Середнє: 0]

コメントを残す

メールアドレスが公開されることはありません。

− 4 = 3