[主題] [動作] in [場所], [時間帯], [映画的または雰囲気のキューを 1 つ].
LitMedia Happy Horse 1.0 プロンプティングガイド:LitMedia で動画を作成するためのベストプラクティス
Happy Horse 1.0 は簡潔なプロンプトと相性が良いモデルです。多くの場合、優れた動画プロンプトに必要なのは約 20 語だけです。主題、動作、場所、そして明確な映画的キューを 1 つ入れます。ショットがカメラ方向に大きく依存する場合のみ、情報を追加してください。より複雑なシーンでは、長い段落よりも、タイムコード付きのショットリストや Markdown セクションのような構造化形式の方が効果的です。
このガイドでは、理想的なプロンプト構造、避けるべきよくあるミス、効果が確認されたプロンプトパターン、既知の制限、LitMedia ユーザー向けのすぐ使えるプロンプト集を扱います。
01 Happy Horse 1.0 で短いプロンプトが最適な理由
LitMedia で Happy Horse 1.0 のプロンプトを数百件テストした結果、短いプロンプトほどクリーンで信頼感のある結果になりやすいことが明確になりました。約 20 語が、多くの場合の最適なバランスです。
シンプルな構造は、モデルにシーンを決定するための十分な情報を与えつつ、過剰な負荷をかけません。プロンプトが細かくなりすぎると、品質は下がりがちです。顔が汎用的になったり、手の構造が崩れたり、歩行や走行などの動きが不自然になったりします。
1.1 理想的なプロンプト構造
理想的な式はシンプルです:
例:
- 赤いコートを着た若い女性が夜の雨に濡れた街路を歩く、ネオンの反射。
- チェリーレッドの 1965 年式 Mustang が正午の曲がりくねった海岸道路を走る。
- オレンジ色のトラ猫がベルベットのソファから背の高いオーク材の本棚へ飛び移る。
最初の一文がほとんどの情報を担います。必要でない限り、衣装、照明、カメラ設定を過剰に説明しないでください。
02 デフォルトのプロンプトテンプレート
このテンプレートは、ほとんどの単一ショット生成に適しています。モデルが理解しやすいよう、できるだけシンプルな言葉を使ってください。
[主題] [動作] in [場所], [時間帯], [雰囲気またはカメラキューを 1 つ].
この構造は、具体性と明確さのバランスを取ります。Happy Horse 1.0 に十分な方向性を与え、強い構図、自然な動き、安定した主題表現を引き出します。
参考にできる効果的なプロンプト:
- サイクリストが夜明けの霧深い森の小道を走る、柔らかな金色の逆光。
- シェフがモダンなキッチンで新鮮な野菜を切る、暖かな朝の光。
- ゴールデンレトリバーが夕暮れの雪原を走る、長い影。
迷ったら簡略化してください。主題 1 つ、動作 1 つ、場所 1 つ、視覚キュー 1 つです。
03 簡潔さが動きと一貫性を改善する理由
プロンプト内のすべての単語は、モデルの注意を取り合います。詳細を増やしすぎると注意が分散します。これは動きの生成で特に目立ちます。
たとえば、次のようなシンプルなプロンプトです:
プロンプト:
子どもが野原を走る。
出力動画:
このような短いプロンプトは、衣装の細部、埃の効果、複数の照明指示を詰め込んだプロンプトよりも、自然な身体動作を生みやすくなります。
プロンプト長の比較:
6 語
主題と動きは出ますが、曖昧すぎることがあります。
約 20 語
具体性と明確さの最も良いバランスです。
200 語以上
硬い動き、顔のぶれ、視覚的一貫性の低下が起きやすくなります。
同じ原則は動物にも当てはまります。リアリティが重要な場合、単純な「猫がジャンプする」というプロンプトが、過度に装飾された映画的な表現より良い結果を出すことがあります。
04 スロップ回避ルール:避けるべき単語
文学的な形容詞の多くは、単一で具体的な出力に対応しないため、AI 動画生成には向きません。このセクションでは、よく使われる語の一部を整理します。印象的に聞こえる形容詞でも、結果を改善することは少なく、むしろ出力を汎用的にしがちです。
避けるべき語:
美しい、圧倒的、素晴らしい、傑作、壮大、息をのむ、超詳細、ハイパーリアル、異常なほど詳細
代わりに、具体的な視覚言語を使う:
曇天の昼光、濡れたアスファルト、ネオンピンクとシアンの反射、暖かなアンバーの逆光、35mm 望遠レンズ、浅い被写界深度、単一の硬いトップライト、ナトリウム灯の街灯
注記
誇張よりも具体性が常に勝ります。
05 強い映画的キューを 1 つ使う
一般的に、動画に細かい映画的ショット説明を入れすぎると AI が混乱し、結果に影響します。さらに、こうした指示にはかなり正確なショット表現が必要です。複数の映画的指示を積み重ねると、それぞれが弱まりがちです。主要な視覚キューを 1 つ選んでください:
- レンズの選択
- 照明設定
- カメラ移動
例:
- 35mm 望遠、浅い被写界深度
- 冷たい環境影に対する暖かなリムライト
- 被写体の後ろからゆっくり追うトラッキングドリー
密接に関連した 2 つから 3 つのキューは機能しますが、5 つ並べると打ち消し合いやすくなります。
カメラ言語の比較:
出力動画
カメラ言語なし:踊るバレエダンサーの後ろからゆっくり追うドリーショット。カメラが迷い、一般的な歩きに見える可能性があります。
出力動画
カメラ言語あり:踊るバレエダンサーの後ろからゆっくり追うドリーショット。適切なレンズ圧縮を伴う、本物のトラッキングショットに近づきます。
同様に同義語の積み重ねも避けてください。"深紅、緋色、ルビーレッド" と書いても色は強まりません。正確な 1 語で十分です。
06 ネガティブプロンプト:控えめに使う
曖昧または否定的なプロンプトは、Happy Horse がより良い動画を生成する助けにはなりません。むしろ計算リソースを消費し、AI にこれらの語を任意に解釈する余地を与えるため、混乱した出力につながります。多くのネガティブ指示は、Happy Horse 1.0 にとって貴重なプロンプトスペースを浪費します。
有用
画面内に人物なし;表示される文字なし
通常は不要
カメラ揺れなし;ぼけなし;歪みなし
自然に起きにくい問題であれば、ネガティブプロンプトは省略してください。
07 名前を出すより、技法を説明する
有名な撮影監督や映画監督の名前だけを参照しても、安定した結果にはつながりにくいです。Roger Deakins style のように書く代わりに、見た目を直接説明できます:
- 逆光のシルエット
- 拡散した朝霧
- 抑制された寒色パレット
- ゆっくりしたトラッキングドリー
技術的な説明は、名前だけの参照より一貫して効果的です。
08 長いプロンプトが有効な場合
カメラ言語が確立されている場合、少し長い指示は許容され、望む結果を得るうえで実際により効果的になることもあります。長いプロンプトは、カメラの動きがショットの中心である場合に最も有効です。
Happy Horse 1.0 は、次のようなカメラモーションを非常にうまく扱えます:
- 滑らかなトラッキングショット
- ゆっくりしたドリーイン
- 視差を伴う横方向のオービットショット
- 空撮ドローンのフライオーバー
- 固定カメラ構図
カメラ移動がシーンを定義する場合は、十分に説明して構いません。ただし焦点は絞ってください。カメラキューをプロンプトの終盤に置くと、より重みが出ることがあります。
09 長いプロンプトに最適な 2 つの構造
長すぎるプロンプトはモデルの誤解につながることがあります。Happy Horse が意図をよりよく理解できるよう、プロンプト入力時には具体的な形式を使うべきです。同時に、この形式は考えを整理する助けにもなります。長い散文はモデルを混乱させることがあります。プロンプトが 1 文を超える場合は、次の構造のいずれかを使ってください。
9.1 タイムコード付きショットリスト
個々のショットの視点から内容を説明する方法で、複数ビートのアクションに最適です。
ショット 1(ワイドの導入ショット、0-1秒):夜の雨の降る都市の路地。ネオンの店舗看板が水たまりに反射している。 ショット 2(ミドルのトラッキング、1-4秒):深紅のコートを着た女性が歩道を足早に歩く。カメラは彼女の横を追う。 ショット 3(ゆっくり寄るクローズアップ、4-5秒):冷たい空気に白い息が上がる中、カメラが彼女の顔へゆっくり近づく。
出力動画:
ショットリスト形式はアクションを明確に分け、各ビートを正しく配置する助けになります。
9.2 Markdown セクション
必要な内容を Markdown 形式で記述し、上記の構造セクションの各要素に分解します。複数のクリエイティブ要素を含む単一の連続テイクに最適です。
## 主題 深紅のウールコートを着た女性。 ## 動作 雨に濡れた通りを足早に歩く。 ## 場所 夜のネオンに照らされたマンハッタンの脇道。 ## カメラ 滑らかなトラッキングショット、35mm 望遠、浅い被写界深度。 ## 照明 暖かなアンバーのリムライト、冷たいブルーのフィルライト、ネオンの反射。 ## ムード 親密で、映画的で、内省的。
出力動画:
主題、動作、照明、カメラ指示が混ざり合うのを防げます。
10 避けるべき間違った形式
Happy Horse 1.0 は自然な文章で最もよく機能します。機械可読に見えても、モデルが理解しにくい形式は避けてください。
- booru 風タグリスト
- JSON プロンプト構造
- 重み付き括弧
- 断片的なキーワード列
標準的な自然文は、これらの形式より一貫して良い結果を出します。
11 特に効果的なプロンプトパターン
これらのプロンプトパターンを参考にし、必要に応じて組み合わせてください。
11.1 カメラモーション
- 滑らかなトラッキングショット
- ステディカムの動き
- ゆっくりしたドリーイン
- 空撮フライオーバー
- 固定のワイドフレーム
11.2 雰囲気のある照明
- ブルーアワーの都市景観
- ネオンノワールの反射
- 霧深い夜明けの逆光
- 単一光源のドラマチックな照明
11.3 乗り物と機械的オブジェクト
車、バイク、電車、航空機は剛体形状のため、特に良く描画されます。
11.4 布と二次的な動き
- 強風のマント
- 流れるドレス
- 旗とバナー
- 動く長い髪
11.5 火と粒子
- 焚き火
- ろうそくの炎
- 火花と燃えさし
- 煙の軌跡
11.6 反射と鏡
鏡のショットや反射面は、印象的な幾何的一貫性で処理されることがよくあります。
11.7 短く読める文字
2、3 語のシンプルな看板、タイトル、ラベルは正確に描画されやすいです。
12 失敗しやすいプロンプトパターン
12.1 散文での複数ステップ動作
次のようなプロンプトは:
最初にドアを開け、次に入り、その後座る。
1 つの混ざった動きに崩れがちです。代わりにショットリストを使えます。
12.2 極端なスローモーション
1000fps の超スローモーションのような指定は、本物の高速撮影効果になりにくいです。水滴が完全に止まるのではなく、穏やかに遅くなる程度を想定してください。
12.3 高速動作中の細かい衣装
素早い動きでは衣装の細部がずれやすくなります。キャラクターが走る、跳ぶ、素早く回転する場合、複雑な服装は簡略化されることがあります。
13 LitMedia LitVideo で使える Happy Horse 1.0 コピペ用プロンプトテンプレート
13.1 20 語の単一ショット
[主題] [動作] in [場所], [時間帯], [雰囲気キューを 1 つ].
例:
出力動画
犬が晴れた朝の光の下を走っている、ディズニー風カートゥーンスタイル。
13.2 カメラ移動を加えた強化単一ショット
[主題 + 衣装] [動作] in [場所]. [カメラ移動 + レンズ]. [照明キュー]. [ムード].
例:
出力動画
犬が晴れた朝の光の下、通りでボール遊びをしている。滑らかなトラッキングショット、35mm 望遠。ネオンの反射。映画的で親密。
13.3 複数ビートのショットリスト
ショット 1([フレーミング]、0-X秒):[セットアップ] ショット 2([フレーミング]、X-Y秒):[主要アクション] ショット 3([フレーミング]、Y-Z秒):[解決]
13.4 雰囲気を作るエスタブリッシングショット
[場所] at [時間], [天候キュー], [構図キュー].
例:
出力動画
真夜中のネオンに照らされた路地、漂う霧、水たまりに揺らめく反射。
13.5 Markdown セクション付き連続テイク
## 主題 [主題] ## 動作 [動作] ## 場所 [場所、時間、天候] ## カメラ [動き、レンズ、フレーミング] ## 照明 [光の方向と色] ## ムード [ムードの説明]
14 生成前チェックリスト
LitMedia で Happy Horse 1.0 動画を生成する前に、次を確認してください:
- 最初の文で主題と動作が明確ですか?
- 複雑さが必要な場合を除き、プロンプトは 30 語未満ですか?
- 長い場合、ショットリストまたは Markdown セクションを使っていますか?
- 主要な映画的キューを 1 つ選びましたか?
- 曖昧な形容詞を削除しましたか?
- カメラ移動が重要な場合、終盤に置いていますか?
- 複数ステップの動作にはタイムコードを入れていますか?
- 自然な文章で書かれていますか?
最後に
成功する Happy Horse 1.0 動画の多くは、シンプルで規律あるプロンプトから生成されます。同じシーンを何度も再生成している場合、問題はモデルではなく、プロンプトが複雑すぎることにある場合が多いです。
まずは 20 語テンプレートから始めてください。ショットが本当に必要とする場合だけ複雑さを追加します。適切な構造があれば、LitMedia の Happy Horse 1.0 は、最初の数回の生成で映画的かつ高い制御性を持つ動画結果を生み出せます。