SAG:用 SQL JOIN 取代向量搜尋的 RAG 新架構 — 兼論 Hermes 記憶進化
🪧 AdSense 廣告
一句話
Zleap-AI 提出 SAG,將文字拆成「事件+實體」存 SQL,查詢時用 JOIN 動態建局部超邊,三基準 9 項 Recall 中 8 項最佳,已部署數億筆生產環境。
關鍵數據
| 項目 | 數據 |
|---|---|
| 論文 | arXiv:2606.15971 (2026-06-14) |
| 團隊 | Zleap-AI |
| 三基準 9 項 Recall | 8/9 最佳 |
| MuSiQue Recall@5 | 80.0% |
| 生產規模 | 數億筆,線上秒級 |
| 程式碼 | github.com/Zleap-AI/SAG-Benchmark |
機制拆解
- 事件化存儲:每段文字拆成一個語意完整事件 + 多個索引實體,不做全域圖。
- 查詢時動態 JOIN:SQL JOIN 共享實體的事件,形成局部超邊——等於每次查詢都即時建自己的索引。
- 標準 DB 基礎設施:依賴 SQLite/PostgreSQL,天然支援增量寫入、並發、水平擴展。
- 不做全域圖的哲學:省去圖重建、碎片化、維護成本,查詢時才決定關聯。
落地應用:Hermes 記憶架構評估
Hermes 的 fact_store 已是 SQLite+FTS5,與 SAG 同方向。關鍵差異在於 fact_store 缺實體層。改法只要加一個 entity_tags 欄位,寫入時用輕量 LLM 抽實體(Agnes Flash 免費),查詢時 JOIN 取代 LIKE。
但現在不急著改。83 條事實的規模下 FTS5 已夠用。論文真正的價值不是 SQL JOIN 技術,而是驗證了 Hermes 選 SQLite 而非 Neo4j 是正確的架構決策。等 fact_store 長到 500+ 條再進化。
🪧 AdSense 廣告