方法論:論點如何變成 Gap 分數

四步流水線,把自然語言投資論點轉換成一個可比較的機率差距數字。全流程透明,每一步都能獨立驗證。

一句話版本

拆解 → 擷取 → 分類 → 計分。主模型把論點拆成可驗證的子聲明,Polymarket API 擷取對應市場, 雙模型集成判斷方向,加權公式算出 -100 到 +100 的 Gap 分數。典型耗時 30-90 秒。

輸入是你寫的任何長度自然語言論點。輸出是一組原子子聲明,每條包含:

模型:主模型(大語言模型 API)。選它是因為長論點裡隱含條件的挖掘能力 — 上一代模型經常把「BTC 年底破 12 萬」這種原子聲明當成一條,但主模型會意識到其中同時蘊含了時間、價格和「破」(達到 or 超過?)三個獨立可驗證維度。

溫度設為 0.1 保證同一輸入輸出穩定。失敗後有一次重試, 再失敗就在該論點上標記 decompose_failed 並自動退回點數。

每條子聲明帶著自己的 search_keywords, 查詢 Polymarket CLOB API 的 /markets 端點。只保留:

剩下的候選按關鍵字相關度 + 成交量排名,每條子聲明取 Top 5 送入第 3 步。

如果某條子聲明一個候選都找不到(例如論點涉及 Polymarket 從不覆蓋的細分主題), 系統會把這條子聲明標記為 polymarket_matchability = "none", 交給第 3 步之外的 AI fallback(見下方「無比對項的處理」)。

有了候選市場池,接下來要判斷每個市場相對於子聲明的方向:

這一步用雙模型集成:兩個獨立家族的大模型並行對同一 (子聲明, 市場) 對給出標籤, 投票一致時直接採用,不一致時以主模型為準。

為什麼不信任單模型?投資領域的語意歧義很細 — 「Fed 不降息」和「Fed 保持利率不變」在市場術語裡不完全等價(後者排除了升息可能性)。讓兩個不同家族的模型獨立判斷, 可以捕捉單模型的盲區。實測雙模型一致率約 82%,剩 18% 的分歧中主模型勝率略高 (人工驗證),所以平手時偏向主模型。

無比對項的處理:如果某條子聲明在第 2 步拿到 0 個候選市場, 另一隻獨立的備用模型會對這條子聲明單獨產生一段 100-200 字的獨立分析, 在前端明確標註 「AI 獨立分析 · 非市場訊號」(琥珀色卡片)。使用者可以判斷是否把它納入 Gap 計算。

最後一步純計算,在瀏覽器裡即時跑。每條子聲明 i 有:

m_i 是候選市場池內所有市場機率的方向加權: 支持方向的市場按 +P 計入,反對方向按 1-P, 中立的不計。再按相關度歸一。

最終 Gap 分數:

Gap = 100 × ( Σᵢ wᵢ × (uᵢ - mᵢ) ) / ( Σᵢ wᵢ )

範圍 -100 到 +100。正數 = 你比市場更樂觀 / 更看多這個論點成立; 負數 = 你比市場更悲觀 / 更看空。0 附近意味著你的假設幾乎完全符合共識。

顏色分檔:|Gap| < 10 綠色(基本一致),10-25 黃色(顯著分歧), > 25 紅色(你和共識差距很大,值得重審假設)。

以下情況會自動退回點數:

如果第 2 步所有子聲明都 0 比對 — 不退款, 但第 3 步的 AI fallback 會對每條產生獨立分析,你看到的仍是一份有內容的報告, 只是 Gap 分數會基於純 AI 訊號而非市場。

Polymarket 覆蓋有偏。美國政治、加密、特定總體事件覆蓋極密,但中小型股、中國總體、私人市場幾乎空白。涉及後者的論點會大量走 AI fallback,市場訊號占比低。
流動性雜訊。成交量 < $10K 的市場機率可能單筆 $1000 訂單就偏離 5-10%。我們過濾了 24h 成交 < $1K 的極薄市場,但 $1K-$10K 區間仍會被納入 — 這些市場的機率應當理解為弱訊號。
AI 分類有錯。雙模型集成後仍有約 5-8% 的 (聲明, 市場) 對被標錯方向。分析詳情頁允許使用者手動覆寫每條 link 的方向標籤。
地理限制。Polymarket 在美國受 CFTC 限制,在中國大陸無法存取, 在部分司法管轄區(印度、多個中東國家)合法性未定。不建議在這些地區參與市場 — 但讀取市場資料做研究通常合規(屬於公開資訊)。

準備好試試了?