#vector-search

6 篇文章

ai deep-dive 2026年6月4日

語意相似 ≠ 檢索相關：embedding 檢索系統性失靈的情境、偵測與補救

Cosine similarity 和 relevance 在一整類情境系統性背離：否定詞（NevIR 上多數 IR 模型 ≤ 隨機）、精確識別碼、數值門檻、邏輯組合（SoTA 模型在 LIMIT 上 recall@100 < 20）——其中一部分是單向量範式的理論上限，換大模型無解。補救順序：hybrid BM25 → reranker（Anthropic 實測 −67%）→ 上游 metadata 路由 → 領域微調 / multi-vector。

#retrieval #embedding #rag #vector-search #llm

tech deep-dive 2026年3月28日

當 Vector Search 把名字當難度搜：RAG 系統的 Attribute Conflation 問題

查詢「美人照鏡 5.11b，推薦類似難度路線」，結果回來的全是名字像的路線而不是難度像的。根因是 dense embedding 把多個屬性壓進同一個向量，名稱的稀有性壓過了難度信號。解法：metadata pre-filter + query rewriting + score fusion 三層防線。

#rag #vector-search #embedding #cloudflare-workers #recommendation-system

ai guide 2026年3月12日