核心功能
語意影片搜尋
用自然語言描述任意時刻,ShotAI在300毫秒內從整個素材庫中找到匹配鏡頭。無需手動標籤,無需關鍵字——由OmniSpectra驅動的純自然語言搜尋。
自然語言查詢
輸入你腦海中的畫面——「夜晚城市的大遠景,憂鬱氛圍」——ShotAI按視覺和語意相關性返回匹配鏡頭,無論標籤或檔案名稱是什麼。
300毫秒內檢索
由OmniSpectra的近似最近鄰向量搜尋驅動,結果隨輸入即時出現——即使素材庫包含數萬個索引鏡頭。
多模態理解
OmniSpectra同時處理影片、音訊和文字,建立統一的語意表示,在單一向量中捕捉視覺內容、對話、攝影機運動和情緒基調。
鏡頭級精度
一個2小時的訪談變成數百個可搜尋單元。搜尋返回精確鏡頭——而不是包含它的檔案。不再需要拖動進度條瀏覽長時間線。
多語言搜尋
支援英語、中文或其他語言搜尋。OmniSpectra的視覺語意搜尋與語言無關——無論素材中使用什麼語言。
零手動標注
匯入素材即刻搜尋。ShotAI從實際視覺內容自動索引每一幀——而非人工描述。完全未標注的素材庫同樣完全可搜尋。
你可以搜尋什麼
語意搜尋理解廣泛的視覺和情境維度。
視覺構圖
取景、主體與動作、背景與環境——從「眼部極端特寫」到「森林小路,斑駁光影」。
電影屬性
攝影機運動、照明品質、景深——「緩慢前推」、「黃金時段逆光」、「淺焦,背景模糊」。
氛圍與基調
情緒特質如「緊張,近距離,期待」或「歡樂,慶祝,戶外」。支援在單次查詢中組合多個維度。
< 300ms
數萬個鏡頭的搜尋延遲
業界頂級召回率
在專業影片基準測試中優於TwelveLabs Marengo 2.7和Amazon Nova
鏡頭級
索引單個鏡頭,而非片段或場景
語意搜尋 vs 傳統方法
關鍵字搜尋
只能找到已標注的內容。標注為「外景,城市」的鏡頭不會出現在「城市建立鏡頭,黃昏」的搜尋中。同義詞和視覺特質不可見。
手動標注
準確但昂貴。每位剪輯師每天約標注10小時素材。完整覆蓋在實踐中幾乎不可能,且標籤會錯過感受、能量和光線。
語意搜尋
零人工輸入。直接從實際視覺內容理解素材,而非人工描述。素材庫在索引完成的那一刻就完全可搜尋。
工作流整合
- 在結果面板中預覽任意鏡頭再選擇
- 從單次搜尋中多選鏡頭,建構粗剪
- 透過EDL或FCPXML匯出到Premiere Pro、DaVinci Resolve或Final Cut Pro
- 從素材庫其他位置發現視覺和語意相似的鏡頭
- 將搜尋儲存為智慧合輯,隨新素材加入自動更新
運作原理
匯入素材庫
拖放資料夾或連接現有媒體儲存。ShotAI在本地索引素材,無需上傳到雲端。
AI分析每個鏡頭
OmniSpectra處理視覺內容、音訊、攝影機運動和構圖,為每個鏡頭即時建構豐富的語意索引。
搜尋與發現
輸入自然語言查詢,即刻看到排序結果。將鏡頭直接匯出到剪輯時間線。
常見問題
語意搜尋在沒有標籤或元數據的情況下也能運作嗎?
可以。語意搜尋完全基於影片內容本身的AI產生嵌入運作。不需要手動標籤、檔案名稱或元數據欄位。
ShotAI如何處理多語言素材?
OmniSpectra的視覺語意搜尋與語言無關——無論素材中的口語是什麼,它都能理解視覺上發生的事情。
隨著素材庫增長,搜尋效能會如何變化?
ShotAI使用近似最近鄰向量搜尋,可以高效擴展。數萬個鏡頭的素材庫,搜尋延遲保持在300毫秒以內。
我可以同時跨多個專案搜尋嗎?
可以。所有已索引專案的素材都可以從單個查詢中搜尋,除非你明確將搜尋範圍限定在特定素材庫內。