方法論:論點如何變成 Gap 分數

四步流水線,把自然語言投資論點轉換成一個可比較的機率差距數字。全流程透明,每一步都能獨立驗證。

一句話版本

拆解 → 擷取 → 分類 → 計分。主模型把論點拆成可驗證的子聲明,Polymarket API 擷取對應市場, 雙模型集成判斷方向,加權公式算出 -100 到 +100 的 Gap 分數。典型耗時 30-90 秒。

第 1 步:拆解論點

輸入是你寫的任何長度自然語言論點。輸出是一組原子子聲明,每條包含:

  • claim_text:一句可驗證的陳述(「聯準會在 2026 年 12 月前累計降息不超過 50bps」)
  • timeframe:明確時間窗口(「2026-12-31 前」)
  • verifiable_predicate:機器可判定的條件(「fed_funds_rate 下降 ≤ 0.005」)
  • search_keywords:3-5 個用於第 2 步擷取的關鍵字
  • importance:critical / high / medium,用於第 4 步加權

模型:主模型(大語言模型 API)。 選它是因為長論點裡隱含條件的挖掘能力 — 上一代模型經常把「BTC 年底破 12 萬」 這種原子聲明當成一條,但主模型會意識到其中同時蘊含了時間、價格和 「破」(達到 or 超過?)三個獨立可驗證維度。

溫度設為 0.1 保證同一輸入輸出穩定。失敗後有一次重試, 再失敗就在該論點上標記 decompose_failed 並自動退回點數。

第 2 步:擷取市場

每條子聲明帶著自己的 search_keywords, 查詢 Polymarket CLOB API 的 /markets 端點。 只保留:

  • 狀態為 active(未結算)
  • 24 小時成交量 > $1,000(排除完全沒流動性的長尾市場)
  • 截止日期在子聲明時間窗口之內

剩下的候選按關鍵字相關度 + 成交量排名,每條子聲明取 Top 5 送入第 3 步。

如果某條子聲明一個候選都找不到(例如論點涉及 Polymarket 從不覆蓋的細分主題), 系統會把這條子聲明標記為 polymarket_matchability = "none", 交給第 3 步之外的 AI fallback(見下方「無比對項的處理」)。

第 3 步:分類方向

有了候選市場池,接下來要判斷每個市場相對於子聲明的方向:

  • 支持(aligns):市場「YES」機率高 = 子聲明為真的機率高
  • 反對(contradicts):市場「YES」機率高 = 子聲明為假的機率高
  • 中立(neutral):兩者不直接相關

這一步用雙模型集成:兩個獨立家族的大模型並行對同一 (子聲明, 市場) 對給出標籤, 投票一致時直接採用,不一致時以主模型為準。

為什麼不信任單模型?投資領域的語意歧義很細 — 「Fed 不降息」和「Fed 保持利率不變」 在市場術語裡不完全等價(後者排除了升息可能性)。讓兩個不同家族的模型獨立判斷, 可以捕捉單模型的盲區。實測雙模型一致率約 82%,剩 18% 的分歧中主模型勝率略高 (人工驗證),所以平手時偏向主模型。

無比對項的處理:如果某條子聲明在第 2 步拿到 0 個候選市場, 另一隻獨立的備用模型會對這條子聲明單獨產生一段 100-200 字的獨立分析, 在前端明確標註 「AI 獨立分析 · 非市場訊號」(琥珀色卡片)。 使用者可以判斷是否把它納入 Gap 計算。

第 4 步:計算 Gap 分數

最後一步純計算,在瀏覽器裡即時跑。每條子聲明 i 有:

  • ui:使用者拖動滑桿輸入的主觀機率(0-1)
  • mi:該子聲明比對市場的方向加權機率
  • wi:子聲明重要性權重(critical=3, high=2, medium=1)

mi 是候選市場池內所有市場機率的方向加權: 支持方向的市場按 +P 計入,反對方向按 1-P, 中立的不計。再按相關度歸一。

最終 Gap 分數:

Gap = 100 × ( Σᵢ wᵢ × (uᵢ - mᵢ) ) / ( Σᵢ wᵢ )

範圍 -100 到 +100。正數 = 你比市場更樂觀 / 更看多這個論點成立; 負數 = 你比市場更悲觀 / 更看空。0 附近意味著你的假設幾乎完全符合共識。

顏色分檔:|Gap| < 10 綠色(基本一致),10-25 黃色(顯著分歧), > 25 紅色(你和共識差距很大,值得重審假設)。

失敗怎麼辦?

以下情況會自動退回點數:

  • 第 1 步失敗(主模型拒絕拆解或重試後仍報錯)
  • 第 1 步產出 0 條有效子聲明
  • 後台任務超過 90 秒無回應(通常是 Vercel serverless 逾時)

如果第 2 步所有子聲明都 0 比對 — 不退款, 但第 3 步的 AI fallback 會對每條產生獨立分析,你看到的仍是一份有內容的報告, 只是 Gap 分數會基於純 AI 訊號而非市場。

已知侷限

  • Polymarket 覆蓋有偏。美國政治、加密、特定總體事件覆蓋極密,但中小型股、中國總體、私人市場幾乎空白。 涉及後者的論點會大量走 AI fallback,市場訊號占比低。
  • 流動性雜訊。成交量 < $10K 的市場機率可能單筆 $1000 訂單就偏離 5-10%。 我們過濾了 24h 成交 < $1K 的極薄市場,但 $1K-$10K 區間仍會被納入 — 這些市場 的機率應當理解為弱訊號。
  • AI 分類有錯。雙模型集成後仍有約 5-8% 的 (聲明, 市場) 對被標錯方向。 分析詳情頁允許使用者手動覆寫每條 link 的方向標籤。
  • 地理限制。Polymarket 在美國受 CFTC 限制,在中國大陸無法存取, 在部分司法管轄區(印度、多個中東國家)合法性未定。不建議在這些地區參與市場 — 但讀取市場資料做研究通常合規(屬於公開資訊)。

ThesisGap 不構成投資建議。Polymarket 的機率反映真金白銀的群眾共識,但受流動性、地理分佈與基準率偏差影響。AI 生成的補充分析明確標註為模型觀點,非市場價格。

市場保持非理性的時間,可能比你能保持償付能力的時間更長。

方法論 · 論點 → 原子聲明 → 市場 → Gap 分數 · ThesisGap