Seedance 2.0 Mini 登場!價格更親民,效果不打折!Use Now
首頁>Happy Horse 1.0 提示詞指南

LitMedia Happy Horse 1.0 提示詞指南:使用 LitMedia 創作影片的最佳實踐

Happy Horse 1.0 更適合簡潔提示詞。多數情況下,一條優秀的影片提示詞只需要約二十個詞:一個主體、一個動作、一個場景,以及一個明確的電影感提示。只有當鏡頭方向對畫面至關重要時,才需要加入更多內容。對於更複雜的場景,帶時間碼的分鏡清單或 Markdown 分段,通常比冗長段落更有效。

本指南涵蓋理想提示詞結構、常見錯誤、已驗證的提示詞模式、已知限制,以及可供 LitMedia 使用者直接套用的提示詞庫。

01 為什麼短提示詞最適合 Happy Horse 1.0

在 LitMedia 中用 Happy Horse 1.0 測試數百條提示詞後,一個規律非常明顯:更短的提示詞通常能產生更乾淨、更可信的結果。約二十個詞通常是最佳平衡點。

簡單結構能給模型足夠資訊去確定場景,同時不會讓模型負擔過重。當提示詞過於詳細時,品質往往下降。臉部可能變得普通,手部結構可能失真,動作,尤其是走路或跑步,可能開始顯得不自然。

1.1 理想提示詞結構

理想公式很直接:

純文字
[主體] [動作] in [場景], [時間], [一個電影感或氛圍提示].

例如:

  • 一位穿紅色外套的年輕女子在夜晚走過被雨水浸濕的城市街道,霓虹倒影。
  • 一輛櫻桃紅 1965 Mustang 在正午沿著蜿蜒海岸公路行駛。
  • 一隻橘色虎斑貓從天鵝絨沙發跳到高大的橡木書架上。

第一句承載了大部分資訊。除非真的必要,否則不要過度描述服裝、光線或相機設定。

02 預設提示詞模板

這個模板最適合大多數單鏡頭生成。盡量保持語言簡單,因為這能讓模型更容易理解。

純文字
[主體] [執行動作] in [場景], [時間], [一個氛圍或鏡頭提示].

這個結構在具體性與清晰度之間取得平衡。它能給 Happy Horse 1.0 足夠方向,生成更好的構圖、可信動作與穩定主體。

你可以參考的一些有效提示詞:

  • 一名騎行者在黎明穿過霧氣瀰漫的森林小徑,柔和金色逆光。
  • 一位廚師在現代廚房切新鮮蔬菜,溫暖晨光。
  • 一隻金毛獵犬在日落時跑過雪地,長長陰影。

不確定時就簡化。一個主體、一個動作、一個場景、一個視覺提示。

03 為什麼簡潔能改善動作與一致性

提示詞中的每個詞都在爭奪模型注意力。加入太多細節會分散注意力,這在動作生成中尤其明顯。

像這樣的簡單提示詞:

提示詞:

純文字
一個孩子跑過田野。

輸出影片:

像這樣的短提示詞,通常比塞滿服裝細節、灰塵效果與多重光線指令的版本更容易生成自然的人體動作。

提示詞長度比較:

6 個詞

主體和動作較泛化,但通常太模糊。

約 20 個詞

具體性與清晰度的最佳平衡。

200+ 個詞

更容易出現僵硬動作、臉部漂移與視覺不一致。

同樣原則也適用於動物。當真實感最重要時,像「一隻貓跳起來」這樣簡單的提示詞,可能比過度修飾的電影感版本表現更好。

04 反空泛規則:應避免的詞

許多文學式形容詞並不適合 AI 影片生成,因為它們無法對應到單一、具體的輸出。在本節中,我們會整理一些更常見的詞。某些形容詞聽起來很有氣勢,但很少改善結果,反而常讓輸出更普通。

避免使用這類詞:

美麗、驚艷、驚人、傑作、史詩級、令人屏息、超細節、超寫實、極度詳細

改用具體視覺語言:

陰天日光、濕瀝青、霓虹粉與青色倒影、溫暖琥珀逆光、35mm 長焦鏡頭、淺景深、單一硬頂光、鈉燈街燈

注意

具體永遠勝過誇飾。

05 使用一個強烈的電影感提示

一般來說,在影片中加入太多詳細的電影鏡頭描述可能會讓 AI 混淆,進而影響結果。此外,這也需要相當準確的鏡頭描述。堆疊多個電影感指令通常會削弱它們。請選擇一個主要視覺提示:

  • 鏡頭選擇
  • 光線設定
  • 相機運動

例如:

  • 35mm 長焦與淺景深
  • 暖色輪廓光對比冷色環境陰影
  • 在主體身後緩慢跟拍推軌

兩到三個緊密相關的提示可以有效,但五個通常會互相抵消。

鏡頭語言對比:

輸出影片

無明確鏡頭語言:在跳舞的芭蕾舞者身後緩慢推軌跟拍。相機可能游移,動作也更普通。

輸出影片

有鏡頭語言:在跳舞的芭蕾舞者身後緩慢推軌跟拍。能更好呈現真正的跟拍鏡頭與正確的鏡頭壓縮感。

同樣,避免堆疊同義詞。寫「深紅、猩紅、寶石紅」不會讓顏色更強烈,一個精準詞就足夠。

06 負面提示詞:謹慎使用

模糊或負面提示詞不會幫助 Happy Horse 生成更好的影片;相反,它們會消耗更多運算資源,並讓 AI 任意解讀這些詞,導致混亂輸出。大多數負面指令都會浪費 Happy Horse 1.0 寶貴的提示詞空間。

有用

畫面中不要有人;不要出現可見文字

通常不必要

不要鏡頭抖動;不要模糊;不要變形

如果某個問題本來就不太可能自然出現,就跳過負面提示詞。

07 描述技法勝過套用名人風格

單純引用知名攝影師或導演,很少能穩定得到理想結果。與其寫 Roger Deakins style,不如直接描述畫面:

  • 逆光剪影
  • 擴散的晨霧
  • 克制的冷色調
  • 緩慢跟拍推軌

技術性描述通常比只引用名字更可靠。

08 什麼時候適合更長的提示詞

當鏡頭語言已經建立後,稍長的指令是可以接受的,而且實際上可能更有效地達成想要的結果。長提示詞最適合鏡頭行為本身是畫面核心的情況。

Happy Horse 1.0 對相機運動的處理尤其出色,包括:

  • 平滑跟拍鏡頭
  • 緩慢推近
  • 帶視差的橫向環繞鏡頭
  • 航拍無人機飛越
  • 固定機位構圖

如果相機運動定義了場景,就給它足夠描述,但保持聚焦。把鏡頭提示放在提示詞末尾,通常能讓它獲得更高權重。

09 更長提示詞的兩種最佳結構

過長的提示詞可能導致模型誤解,因此為了幫助 Happy Horse 更好理解你的意圖,輸入提示詞時應使用特定格式。這個格式也能幫助你整理思路。冗長散文會讓模型混淆。如果提示詞需要超過一句話,請使用以下其中一種結構。

9.1 帶時間碼的分鏡清單

一種從單個鏡頭角度描述內容的方法,最適合多節拍動作。

純文字
鏡頭 1(廣角建立鏡頭,0-1 秒):夜晚下雨的城市小巷,霓虹店面倒映在水坑中。
鏡頭 2(中景跟拍,1-4 秒):一位穿深紅色外套的女子快步走在人行道上。相機在她身旁跟拍。
鏡頭 3(緩慢推近特寫,4-5 秒):寒冷空氣中她的呼吸升起白霧,鏡頭慢慢推近她的臉。

輸出影片:

分鏡清單格式能清楚分隔動作,幫助模型正確安排每個節拍。

9.2 Markdown 分段

使用 Markdown 格式描述你需要的內容,並依照上方結構拆解每個元素。最適合包含多個創意變數的單一連續鏡頭。

純文字
## 主體
一位穿深紅色羊毛外套的女子。
## 動作
快步走過被雨水打濕的街道。
## 場景
夜晚霓虹照亮的曼哈頓側街。
## 鏡頭
平滑跟拍鏡頭,35mm 長焦,淺景深。
## 光線
溫暖琥珀輪廓光,冷藍補光,霓虹倒影。
## 氛圍
親密、電影感、沉思。

輸出影片:

這能避免主體、動作、光線與鏡頭指令互相混在一起。

10 應避免的錯誤格式

Happy Horse 1.0 最適合自然語句。避免看似機器可讀、但模型難以理解的格式。

  • booru 風格標籤列表
  • JSON 提示詞結構
  • 加權括號
  • 碎片化關鍵字串

標準自然語句通常比這些格式表現更好。

11 特別有效的提示詞模式

你可以把這些提示詞模式當作參考,並依需求組合使用。

11.1 相機運動

  • 平滑跟拍鏡頭
  • 穩定器運動
  • 緩慢推近
  • 航拍飛越
  • 固定廣角畫面

11.2 氛圍光線

  • 藍調時刻城市景觀
  • 霓虹黑色電影倒影
  • 霧氣黎明逆光
  • 單一光源戲劇光

11.3 車輛與機械物件

汽車、摩托車、火車與飛機因為幾何結構固定,通常渲染效果很好。

11.4 布料與次級運動

  • 強風中的披風
  • 飄動洋裝
  • 旗幟與橫幅
  • 動態長髮

11.5 火焰與粒子

  • 營火
  • 燭焰
  • 火花與餘燼
  • 煙霧軌跡

11.6 反射與鏡面

鏡面鏡頭與反射表面通常能呈現令人印象深刻的幾何一致性。

11.7 短而可讀的文字

兩到三個詞的簡單招牌、標題與標籤,通常能準確生成。

12 常見容易失敗的提示詞模式

12.1 用普通散文描述多步動作

像這樣的提示詞:

純文字
她先開門,然後進入,再坐下。

常會融合成單一混雜動作。你可以改用分鏡清單。

12.2 極端慢動作

例如 1000fps 超慢動作,通常很難生成真正高速攝影效果。可以期待輕微變慢,但不要期待凝固水滴。

12.3 快速運動中的詳細服裝

快速動作中服裝細節常會漂移。角色奔跑、跳躍或快速旋轉時,複雜服裝可能被簡化。

13 LitMedia LitVideo 中 Happy Horse 1.0 可直接複製的提示詞模板

13.1 二十詞單鏡頭

純文字
[主體] [動作] in [場景], [時間], [一個氛圍提示].

範例:

輸出影片

一隻狗在晴朗的早晨陽光下奔跑,迪士尼卡通風格。

13.2 帶相機運動的增強單鏡頭

純文字
[主體 + 服裝] [動作] in [場景]. [相機運動 + 鏡頭]. [光線提示]. [氛圍].

範例:

輸出影片

一隻狗在晴朗的早晨陽光下在街上玩球。平滑跟拍鏡頭,35mm 長焦。霓虹倒影。電影感且親密。

13.3 多節拍分鏡清單

純文字
鏡頭 1([構圖],0-X 秒):[鋪陳]
鏡頭 2([構圖],X-Y 秒):[主要動作]
鏡頭 3([構圖],Y-Z 秒):[收束]

13.4 氛圍建立鏡頭

純文字
[場景] at [時間], [天氣提示], [構圖提示].

範例:

輸出影片

午夜霓虹照亮的小巷,飄動霧氣,水坑中閃爍倒影。

13.5 Markdown 分段連續鏡頭

純文字
## 主體
[主體]
## 動作
[動作]
## 場景
[地點、時間、天氣]
## 鏡頭
[運動、鏡頭、構圖]
## 光線
[光線方向與顏色]
## 氛圍
[氛圍描述]

14 生成前檢查清單

在 LitMedia 中生成 Happy Horse 1.0 影片前,請確認:

  • 第一句是否清楚包含主體與動作?
  • 除非複雜度需要,提示詞是否少於 30 個詞?
  • 如果提示詞較長,是否使用分鏡清單或 Markdown 分段?
  • 是否選擇了一個主要電影感提示?
  • 是否移除了模糊形容詞?
  • 如果相機運動很重要,是否放在靠近結尾的位置?
  • 對於多步動作,是否包含時間碼?
  • 提示詞是否使用自然語句?

最後想法

多數成功的 Happy Horse 1.0 影片都來自簡單而有紀律的提示詞。如果你反覆重新生成同一場景,問題往往不在模型,而在提示詞過度複雜。

從二十詞模板開始。只有當鏡頭真正需要時才增加複雜度。只要結構正確,LitMedia 的 Happy Horse 1.0 就能在前幾次生成中產出電影感強、可控性高的影片結果。