LitMedia Happy Horse 1.0 提示詞指南：使用 LitMedia 創作影片的最佳實踐

Happy Horse 1.0 更適合簡潔提示詞。多數情況下，一條優秀的影片提示詞只需要約二十個詞：一個主體、一個動作、一個場景，以及一個明確的電影感提示。只有當鏡頭方向對畫面至關重要時，才需要加入更多內容。對於更複雜的場景，帶時間碼的分鏡清單或 Markdown 分段，通常比冗長段落更有效。

本指南涵蓋理想提示詞結構、常見錯誤、已驗證的提示詞模式、已知限制，以及可供 LitMedia 使用者直接套用的提示詞庫。

01 為什麼短提示詞最適合 Happy Horse 1.0

在 LitMedia 中用 Happy Horse 1.0 測試數百條提示詞後，一個規律非常明顯：更短的提示詞通常能產生更乾淨、更可信的結果。約二十個詞通常是最佳平衡點。

簡單結構能給模型足夠資訊去確定場景，同時不會讓模型負擔過重。當提示詞過於詳細時，品質往往下降。臉部可能變得普通，手部結構可能失真，動作，尤其是走路或跑步，可能開始顯得不自然。

1.1 理想提示詞結構

理想公式很直接：

純文字

[主體] [動作] in [場景], [時間], [一個電影感或氛圍提示].

例如：

一位穿紅色外套的年輕女子在夜晚走過被雨水浸濕的城市街道，霓虹倒影。
一輛櫻桃紅 1965 Mustang 在正午沿著蜿蜒海岸公路行駛。
一隻橘色虎斑貓從天鵝絨沙發跳到高大的橡木書架上。

第一句承載了大部分資訊。除非真的必要，否則不要過度描述服裝、光線或相機設定。

02 預設提示詞模板

這個模板最適合大多數單鏡頭生成。盡量保持語言簡單，因為這能讓模型更容易理解。

純文字

[主體] [執行動作] in [場景], [時間], [一個氛圍或鏡頭提示].

這個結構在具體性與清晰度之間取得平衡。它能給 Happy Horse 1.0 足夠方向，生成更好的構圖、可信動作與穩定主體。

你可以參考的一些有效提示詞：

一名騎行者在黎明穿過霧氣瀰漫的森林小徑，柔和金色逆光。
一位廚師在現代廚房切新鮮蔬菜，溫暖晨光。
一隻金毛獵犬在日落時跑過雪地，長長陰影。

不確定時就簡化。一個主體、一個動作、一個場景、一個視覺提示。

03 為什麼簡潔能改善動作與一致性

提示詞中的每個詞都在爭奪模型注意力。加入太多細節會分散注意力，這在動作生成中尤其明顯。

像這樣的簡單提示詞：

提示詞：

純文字

一個孩子跑過田野。

輸出影片：

像這樣的短提示詞，通常比塞滿服裝細節、灰塵效果與多重光線指令的版本更容易生成自然的人體動作。

提示詞長度比較：

6 個詞

主體和動作較泛化，但通常太模糊。

約 20 個詞

具體性與清晰度的最佳平衡。

200+ 個詞

更容易出現僵硬動作、臉部漂移與視覺不一致。

同樣原則也適用於動物。當真實感最重要時，像「一隻貓跳起來」這樣簡單的提示詞，可能比過度修飾的電影感版本表現更好。

04 反空泛規則：應避免的詞

許多文學式形容詞並不適合 AI 影片生成，因為它們無法對應到單一、具體的輸出。在本節中，我們會整理一些更常見的詞。某些形容詞聽起來很有氣勢，但很少改善結果，反而常讓輸出更普通。

避免使用這類詞：

美麗、驚艷、驚人、傑作、史詩級、令人屏息、超細節、超寫實、極度詳細

改用具體視覺語言：

陰天日光、濕瀝青、霓虹粉與青色倒影、溫暖琥珀逆光、35mm 長焦鏡頭、淺景深、單一硬頂光、鈉燈街燈

注意

具體永遠勝過誇飾。

05 使用一個強烈的電影感提示

一般來說，在影片中加入太多詳細的電影鏡頭描述可能會讓 AI 混淆，進而影響結果。此外，這也需要相當準確的鏡頭描述。堆疊多個電影感指令通常會削弱它們。請選擇一個主要視覺提示：

鏡頭選擇
光線設定
相機運動

例如：

35mm 長焦與淺景深
暖色輪廓光對比冷色環境陰影
在主體身後緩慢跟拍推軌

兩到三個緊密相關的提示可以有效，但五個通常會互相抵消。

鏡頭語言對比：

輸出影片

無明確鏡頭語言：在跳舞的芭蕾舞者身後緩慢推軌跟拍。相機可能游移，動作也更普通。

輸出影片

有鏡頭語言：在跳舞的芭蕾舞者身後緩慢推軌跟拍。能更好呈現真正的跟拍鏡頭與正確的鏡頭壓縮感。

同樣，避免堆疊同義詞。寫「深紅、猩紅、寶石紅」不會讓顏色更強烈，一個精準詞就足夠。

06 負面提示詞：謹慎使用

模糊或負面提示詞不會幫助 Happy Horse 生成更好的影片；相反，它們會消耗更多運算資源，並讓 AI 任意解讀這些詞，導致混亂輸出。大多數負面指令都會浪費 Happy Horse 1.0 寶貴的提示詞空間。

有用

畫面中不要有人；不要出現可見文字

通常不必要

不要鏡頭抖動；不要模糊；不要變形

如果某個問題本來就不太可能自然出現，就跳過負面提示詞。

07 描述技法勝過套用名人風格

單純引用知名攝影師或導演，很少能穩定得到理想結果。與其寫 Roger Deakins style，不如直接描述畫面：

逆光剪影
擴散的晨霧
克制的冷色調
緩慢跟拍推軌

技術性描述通常比只引用名字更可靠。

08 什麼時候適合更長的提示詞

當鏡頭語言已經建立後，稍長的指令是可以接受的，而且實際上可能更有效地達成想要的結果。長提示詞最適合鏡頭行為本身是畫面核心的情況。

Happy Horse 1.0 對相機運動的處理尤其出色，包括：

平滑跟拍鏡頭
緩慢推近
帶視差的橫向環繞鏡頭
航拍無人機飛越
固定機位構圖

如果相機運動定義了場景，就給它足夠描述，但保持聚焦。把鏡頭提示放在提示詞末尾，通常能讓它獲得更高權重。

09 更長提示詞的兩種最佳結構

過長的提示詞可能導致模型誤解，因此為了幫助 Happy Horse 更好理解你的意圖，輸入提示詞時應使用特定格式。這個格式也能幫助你整理思路。冗長散文會讓模型混淆。如果提示詞需要超過一句話，請使用以下其中一種結構。

9.1 帶時間碼的分鏡清單

一種從單個鏡頭角度描述內容的方法，最適合多節拍動作。

純文字

鏡頭 1（廣角建立鏡頭，0-1 秒）：夜晚下雨的城市小巷，霓虹店面倒映在水坑中。
鏡頭 2（中景跟拍，1-4 秒）：一位穿深紅色外套的女子快步走在人行道上。相機在她身旁跟拍。
鏡頭 3（緩慢推近特寫，4-5 秒）：寒冷空氣中她的呼吸升起白霧，鏡頭慢慢推近她的臉。

輸出影片：

分鏡清單格式能清楚分隔動作，幫助模型正確安排每個節拍。

9.2 Markdown 分段

使用 Markdown 格式描述你需要的內容，並依照上方結構拆解每個元素。最適合包含多個創意變數的單一連續鏡頭。

純文字

## 主體
一位穿深紅色羊毛外套的女子。
## 動作
快步走過被雨水打濕的街道。
## 場景
夜晚霓虹照亮的曼哈頓側街。
## 鏡頭
平滑跟拍鏡頭，35mm 長焦，淺景深。
## 光線
溫暖琥珀輪廓光，冷藍補光，霓虹倒影。
## 氛圍
親密、電影感、沉思。

輸出影片：

這能避免主體、動作、光線與鏡頭指令互相混在一起。

10 應避免的錯誤格式

Happy Horse 1.0 最適合自然語句。避免看似機器可讀、但模型難以理解的格式。

booru 風格標籤列表
JSON 提示詞結構
加權括號
碎片化關鍵字串

標準自然語句通常比這些格式表現更好。

11 特別有效的提示詞模式

你可以把這些提示詞模式當作參考，並依需求組合使用。

11.1 相機運動

平滑跟拍鏡頭
穩定器運動
緩慢推近
航拍飛越
固定廣角畫面

11.2 氛圍光線

藍調時刻城市景觀
霓虹黑色電影倒影
霧氣黎明逆光
單一光源戲劇光

11.3 車輛與機械物件

汽車、摩托車、火車與飛機因為幾何結構固定，通常渲染效果很好。

11.4 布料與次級運動

強風中的披風
飄動洋裝
旗幟與橫幅
動態長髮

11.5 火焰與粒子

營火
燭焰
火花與餘燼
煙霧軌跡

11.6 反射與鏡面

鏡面鏡頭與反射表面通常能呈現令人印象深刻的幾何一致性。

11.7 短而可讀的文字

兩到三個詞的簡單招牌、標題與標籤，通常能準確生成。

12 常見容易失敗的提示詞模式

12.1 用普通散文描述多步動作

像這樣的提示詞：

純文字

她先開門，然後進入，再坐下。

常會融合成單一混雜動作。你可以改用分鏡清單。

12.2 極端慢動作

例如 1000fps 超慢動作，通常很難生成真正高速攝影效果。可以期待輕微變慢，但不要期待凝固水滴。

12.3 快速運動中的詳細服裝

快速動作中服裝細節常會漂移。角色奔跑、跳躍或快速旋轉時，複雜服裝可能被簡化。

13 LitMedia LitVideo 中 Happy Horse 1.0 可直接複製的提示詞模板

13.1 二十詞單鏡頭

純文字

[主體] [動作] in [場景], [時間], [一個氛圍提示].

範例：

輸出影片

一隻狗在晴朗的早晨陽光下奔跑，迪士尼卡通風格。

13.2 帶相機運動的增強單鏡頭

純文字

[主體 + 服裝] [動作] in [場景]. [相機運動 + 鏡頭]. [光線提示]. [氛圍].

範例：

輸出影片

一隻狗在晴朗的早晨陽光下在街上玩球。平滑跟拍鏡頭，35mm 長焦。霓虹倒影。電影感且親密。

13.3 多節拍分鏡清單

純文字

鏡頭 1（[構圖]，0-X 秒）：[鋪陳]
鏡頭 2（[構圖]，X-Y 秒）：[主要動作]
鏡頭 3（[構圖]，Y-Z 秒）：[收束]

13.4 氛圍建立鏡頭

純文字

[場景] at [時間], [天氣提示], [構圖提示].

範例：

輸出影片

午夜霓虹照亮的小巷，飄動霧氣，水坑中閃爍倒影。

13.5 Markdown 分段連續鏡頭

純文字

## 主體
[主體]
## 動作
[動作]
## 場景
[地點、時間、天氣]
## 鏡頭
[運動、鏡頭、構圖]
## 光線
[光線方向與顏色]
## 氛圍
[氛圍描述]

14 生成前檢查清單

在 LitMedia 中生成 Happy Horse 1.0 影片前，請確認：

第一句是否清楚包含主體與動作？
除非複雜度需要，提示詞是否少於 30 個詞？
如果提示詞較長，是否使用分鏡清單或 Markdown 分段？
是否選擇了一個主要電影感提示？
是否移除了模糊形容詞？
如果相機運動很重要，是否放在靠近結尾的位置？
對於多步動作，是否包含時間碼？
提示詞是否使用自然語句？

最後想法

多數成功的 Happy Horse 1.0 影片都來自簡單而有紀律的提示詞。如果你反覆重新生成同一場景，問題往往不在模型，而在提示詞過度複雜。

從二十詞模板開始。只有當鏡頭真正需要時才增加複雜度。只要結構正確，LitMedia 的 Happy Horse 1.0 就能在前幾次生成中產出電影感強、可控性高的影片結果。