[主體] [動作] in [場景], [時間], [一個電影感或氛圍提示].
LitMedia Happy Horse 1.0 提示詞指南:使用 LitMedia 創作影片的最佳實踐
Happy Horse 1.0 更適合簡潔提示詞。多數情況下,一條優秀的影片提示詞只需要約二十個詞:一個主體、一個動作、一個場景,以及一個明確的電影感提示。只有當鏡頭方向對畫面至關重要時,才需要加入更多內容。對於更複雜的場景,帶時間碼的分鏡清單或 Markdown 分段,通常比冗長段落更有效。
本指南涵蓋理想提示詞結構、常見錯誤、已驗證的提示詞模式、已知限制,以及可供 LitMedia 使用者直接套用的提示詞庫。
01 為什麼短提示詞最適合 Happy Horse 1.0
在 LitMedia 中用 Happy Horse 1.0 測試數百條提示詞後,一個規律非常明顯:更短的提示詞通常能產生更乾淨、更可信的結果。約二十個詞通常是最佳平衡點。
簡單結構能給模型足夠資訊去確定場景,同時不會讓模型負擔過重。當提示詞過於詳細時,品質往往下降。臉部可能變得普通,手部結構可能失真,動作,尤其是走路或跑步,可能開始顯得不自然。
1.1 理想提示詞結構
理想公式很直接:
例如:
- 一位穿紅色外套的年輕女子在夜晚走過被雨水浸濕的城市街道,霓虹倒影。
- 一輛櫻桃紅 1965 Mustang 在正午沿著蜿蜒海岸公路行駛。
- 一隻橘色虎斑貓從天鵝絨沙發跳到高大的橡木書架上。
第一句承載了大部分資訊。除非真的必要,否則不要過度描述服裝、光線或相機設定。
02 預設提示詞模板
這個模板最適合大多數單鏡頭生成。盡量保持語言簡單,因為這能讓模型更容易理解。
[主體] [執行動作] in [場景], [時間], [一個氛圍或鏡頭提示].
這個結構在具體性與清晰度之間取得平衡。它能給 Happy Horse 1.0 足夠方向,生成更好的構圖、可信動作與穩定主體。
你可以參考的一些有效提示詞:
- 一名騎行者在黎明穿過霧氣瀰漫的森林小徑,柔和金色逆光。
- 一位廚師在現代廚房切新鮮蔬菜,溫暖晨光。
- 一隻金毛獵犬在日落時跑過雪地,長長陰影。
不確定時就簡化。一個主體、一個動作、一個場景、一個視覺提示。
03 為什麼簡潔能改善動作與一致性
提示詞中的每個詞都在爭奪模型注意力。加入太多細節會分散注意力,這在動作生成中尤其明顯。
像這樣的簡單提示詞:
提示詞:
一個孩子跑過田野。
輸出影片:
像這樣的短提示詞,通常比塞滿服裝細節、灰塵效果與多重光線指令的版本更容易生成自然的人體動作。
提示詞長度比較:
6 個詞
主體和動作較泛化,但通常太模糊。
約 20 個詞
具體性與清晰度的最佳平衡。
200+ 個詞
更容易出現僵硬動作、臉部漂移與視覺不一致。
同樣原則也適用於動物。當真實感最重要時,像「一隻貓跳起來」這樣簡單的提示詞,可能比過度修飾的電影感版本表現更好。
04 反空泛規則:應避免的詞
許多文學式形容詞並不適合 AI 影片生成,因為它們無法對應到單一、具體的輸出。在本節中,我們會整理一些更常見的詞。某些形容詞聽起來很有氣勢,但很少改善結果,反而常讓輸出更普通。
避免使用這類詞:
美麗、驚艷、驚人、傑作、史詩級、令人屏息、超細節、超寫實、極度詳細
改用具體視覺語言:
陰天日光、濕瀝青、霓虹粉與青色倒影、溫暖琥珀逆光、35mm 長焦鏡頭、淺景深、單一硬頂光、鈉燈街燈
注意
具體永遠勝過誇飾。
05 使用一個強烈的電影感提示
一般來說,在影片中加入太多詳細的電影鏡頭描述可能會讓 AI 混淆,進而影響結果。此外,這也需要相當準確的鏡頭描述。堆疊多個電影感指令通常會削弱它們。請選擇一個主要視覺提示:
- 鏡頭選擇
- 光線設定
- 相機運動
例如:
- 35mm 長焦與淺景深
- 暖色輪廓光對比冷色環境陰影
- 在主體身後緩慢跟拍推軌
兩到三個緊密相關的提示可以有效,但五個通常會互相抵消。
鏡頭語言對比:
輸出影片
無明確鏡頭語言:在跳舞的芭蕾舞者身後緩慢推軌跟拍。相機可能游移,動作也更普通。
輸出影片
有鏡頭語言:在跳舞的芭蕾舞者身後緩慢推軌跟拍。能更好呈現真正的跟拍鏡頭與正確的鏡頭壓縮感。
同樣,避免堆疊同義詞。寫「深紅、猩紅、寶石紅」不會讓顏色更強烈,一個精準詞就足夠。
06 負面提示詞:謹慎使用
模糊或負面提示詞不會幫助 Happy Horse 生成更好的影片;相反,它們會消耗更多運算資源,並讓 AI 任意解讀這些詞,導致混亂輸出。大多數負面指令都會浪費 Happy Horse 1.0 寶貴的提示詞空間。
有用
畫面中不要有人;不要出現可見文字
通常不必要
不要鏡頭抖動;不要模糊;不要變形
如果某個問題本來就不太可能自然出現,就跳過負面提示詞。
07 描述技法勝過套用名人風格
單純引用知名攝影師或導演,很少能穩定得到理想結果。與其寫 Roger Deakins style,不如直接描述畫面:
- 逆光剪影
- 擴散的晨霧
- 克制的冷色調
- 緩慢跟拍推軌
技術性描述通常比只引用名字更可靠。
08 什麼時候適合更長的提示詞
當鏡頭語言已經建立後,稍長的指令是可以接受的,而且實際上可能更有效地達成想要的結果。長提示詞最適合鏡頭行為本身是畫面核心的情況。
Happy Horse 1.0 對相機運動的處理尤其出色,包括:
- 平滑跟拍鏡頭
- 緩慢推近
- 帶視差的橫向環繞鏡頭
- 航拍無人機飛越
- 固定機位構圖
如果相機運動定義了場景,就給它足夠描述,但保持聚焦。把鏡頭提示放在提示詞末尾,通常能讓它獲得更高權重。
09 更長提示詞的兩種最佳結構
過長的提示詞可能導致模型誤解,因此為了幫助 Happy Horse 更好理解你的意圖,輸入提示詞時應使用特定格式。這個格式也能幫助你整理思路。冗長散文會讓模型混淆。如果提示詞需要超過一句話,請使用以下其中一種結構。
9.1 帶時間碼的分鏡清單
一種從單個鏡頭角度描述內容的方法,最適合多節拍動作。
鏡頭 1(廣角建立鏡頭,0-1 秒):夜晚下雨的城市小巷,霓虹店面倒映在水坑中。 鏡頭 2(中景跟拍,1-4 秒):一位穿深紅色外套的女子快步走在人行道上。相機在她身旁跟拍。 鏡頭 3(緩慢推近特寫,4-5 秒):寒冷空氣中她的呼吸升起白霧,鏡頭慢慢推近她的臉。
輸出影片:
分鏡清單格式能清楚分隔動作,幫助模型正確安排每個節拍。
9.2 Markdown 分段
使用 Markdown 格式描述你需要的內容,並依照上方結構拆解每個元素。最適合包含多個創意變數的單一連續鏡頭。
## 主體 一位穿深紅色羊毛外套的女子。 ## 動作 快步走過被雨水打濕的街道。 ## 場景 夜晚霓虹照亮的曼哈頓側街。 ## 鏡頭 平滑跟拍鏡頭,35mm 長焦,淺景深。 ## 光線 溫暖琥珀輪廓光,冷藍補光,霓虹倒影。 ## 氛圍 親密、電影感、沉思。
輸出影片:
這能避免主體、動作、光線與鏡頭指令互相混在一起。
10 應避免的錯誤格式
Happy Horse 1.0 最適合自然語句。避免看似機器可讀、但模型難以理解的格式。
- booru 風格標籤列表
- JSON 提示詞結構
- 加權括號
- 碎片化關鍵字串
標準自然語句通常比這些格式表現更好。
11 特別有效的提示詞模式
你可以把這些提示詞模式當作參考,並依需求組合使用。
11.1 相機運動
- 平滑跟拍鏡頭
- 穩定器運動
- 緩慢推近
- 航拍飛越
- 固定廣角畫面
11.2 氛圍光線
- 藍調時刻城市景觀
- 霓虹黑色電影倒影
- 霧氣黎明逆光
- 單一光源戲劇光
11.3 車輛與機械物件
汽車、摩托車、火車與飛機因為幾何結構固定,通常渲染效果很好。
11.4 布料與次級運動
- 強風中的披風
- 飄動洋裝
- 旗幟與橫幅
- 動態長髮
11.5 火焰與粒子
- 營火
- 燭焰
- 火花與餘燼
- 煙霧軌跡
11.6 反射與鏡面
鏡面鏡頭與反射表面通常能呈現令人印象深刻的幾何一致性。
11.7 短而可讀的文字
兩到三個詞的簡單招牌、標題與標籤,通常能準確生成。
12 常見容易失敗的提示詞模式
12.1 用普通散文描述多步動作
像這樣的提示詞:
她先開門,然後進入,再坐下。
常會融合成單一混雜動作。你可以改用分鏡清單。
12.2 極端慢動作
例如 1000fps 超慢動作,通常很難生成真正高速攝影效果。可以期待輕微變慢,但不要期待凝固水滴。
12.3 快速運動中的詳細服裝
快速動作中服裝細節常會漂移。角色奔跑、跳躍或快速旋轉時,複雜服裝可能被簡化。
13 LitMedia LitVideo 中 Happy Horse 1.0 可直接複製的提示詞模板
13.1 二十詞單鏡頭
[主體] [動作] in [場景], [時間], [一個氛圍提示].
範例:
輸出影片
一隻狗在晴朗的早晨陽光下奔跑,迪士尼卡通風格。
13.2 帶相機運動的增強單鏡頭
[主體 + 服裝] [動作] in [場景]. [相機運動 + 鏡頭]. [光線提示]. [氛圍].
範例:
輸出影片
一隻狗在晴朗的早晨陽光下在街上玩球。平滑跟拍鏡頭,35mm 長焦。霓虹倒影。電影感且親密。
13.3 多節拍分鏡清單
鏡頭 1([構圖],0-X 秒):[鋪陳] 鏡頭 2([構圖],X-Y 秒):[主要動作] 鏡頭 3([構圖],Y-Z 秒):[收束]
13.4 氛圍建立鏡頭
[場景] at [時間], [天氣提示], [構圖提示].
範例:
輸出影片
午夜霓虹照亮的小巷,飄動霧氣,水坑中閃爍倒影。
13.5 Markdown 分段連續鏡頭
## 主體 [主體] ## 動作 [動作] ## 場景 [地點、時間、天氣] ## 鏡頭 [運動、鏡頭、構圖] ## 光線 [光線方向與顏色] ## 氛圍 [氛圍描述]
14 生成前檢查清單
在 LitMedia 中生成 Happy Horse 1.0 影片前,請確認:
- 第一句是否清楚包含主體與動作?
- 除非複雜度需要,提示詞是否少於 30 個詞?
- 如果提示詞較長,是否使用分鏡清單或 Markdown 分段?
- 是否選擇了一個主要電影感提示?
- 是否移除了模糊形容詞?
- 如果相機運動很重要,是否放在靠近結尾的位置?
- 對於多步動作,是否包含時間碼?
- 提示詞是否使用自然語句?
最後想法
多數成功的 Happy Horse 1.0 影片都來自簡單而有紀律的提示詞。如果你反覆重新生成同一場景,問題往往不在模型,而在提示詞過度複雜。
從二十詞模板開始。只有當鏡頭真正需要時才增加複雜度。只要結構正確,LitMedia 的 Happy Horse 1.0 就能在前幾次生成中產出電影感強、可控性高的影片結果。