世界モデル

空間を理解するAIシネマトグラファーとしての設計思想。

私たちが映画のシーンを想像するとき、頭の中には「言葉」だけでなく、「奥行き」「光」「人の動き」といった3Dの映像が浮かんでいるはずです。Directors ConsoleのAIは、まさにこの「頭の中のビジョン」をシミュレートする能力を持っています。

「従来のAI」と「世界モデル」の違い

従来のLLM:言葉のパズル

テキスト → パラメーター → テキスト

「机」の次に「椅子」が来やすいといった確率学習。机の大きさや部屋の中の位置といった物理的な実感は弱い。

世界モデル:空間を「視る」知能

テキスト+画像+動画 → 空間シミュレーション → テキスト

映像から物理法則を学び、テキストを読んだ瞬間にXYZ軸のセットを脳内で構築。仮想の3Dリハーサルが可能。

3Dリハーサルで得られること

  • ① ブロッキング 登場人物を座標として配置。手前・中景・背景と心理的距離を構図に反映。
  • ② 物理的カメラワーク 壁抜けなどの不自然さを避け、レンズ・可動域から撮影可能な動きを提案。
  • ③ 光と陰影 光源の位置からハイライトと影を計算。逆光シルエットなど感情のライティングへ。

AIライターから「AIシネマトグラファー」へ

Directors Consoleは、空間を理解し、カメラを操り、光をデザインする撮影監督としてカットプロンプトを設計します。Google Veo、OpenAI Sora などへの指示精度を高めるための世界モデルです。