#embedding

11 篇文章

ai deep-dive 2026年6月4日

語意相似 ≠ 檢索相關：embedding 檢索系統性失靈的情境、偵測與補救

Cosine similarity 和 relevance 在一整類情境系統性背離：否定詞（NevIR 上多數 IR 模型 ≤ 隨機）、精確識別碼、數值門檻、邏輯組合（SoTA 模型在 LIMIT 上 recall@100 < 20）——其中一部分是單向量範式的理論上限，換大模型無解。補救順序：hybrid BM25 → reranker（Anthropic 實測 −67%）→ 上游 metadata 路由 → 領域微調 / multi-vector。

#retrieval #embedding #rag #vector-search #llm

ai deep-dive 2026年6月4日

換更貴的 embedding 救不了繁中 RAG：三層失敗成因與補救順序

繁中 RAG 檢索失敗是三層疊加：embedding 的粒度缺陷（BGE/GTE 從 0.1B 到 7B 都在「炸鸡」這種簡單 query 上排錯）、簡中/英文語料主導造成的在地詞彙偏移（保費、不保事項對齊不可靠）、MTEB 中文榜是簡體導致選型訊號失真。修復是架構性的：OpenCC 正規化 → hybrid + jieba 斷詞 → reranker → 最後才是在地微調——而且一切前提是先建繁中專屬 eval set。

#rag #embedding #traditional-chinese #retrieval #llm

ai guide 2026年4月18日

knowledge-pipeline：六層管線幫你的 RAG 做品質管控

一個六層確定性管線，從 URL 擷取到向量嵌入全自動處理，透過八維度評分系統在資料進 RAG 之前就篩掉垃圾。

#rag #knowledge-management #pipeline #embedding #bge-m3 #sqlite #quality-control

ai project 2026年3月31日

2026 Q1 開源 LLM 全景圖：從前沿大模型到手機端，完整盤點

2026 Q1 開源模型全面爆發：LLM 方面 GLM-5、Kimi K2.5、Qwen3.5 追上閉源；Embedding 和 Reranker 由 Qwen3 和 BGE 主導；語音有 Voxtral TTS 和 Whisper V3；圖像有 FLUX.2；影片有 Wan 2.2 追平 Sora。這篇是完整導覽地圖。

#open-source #llm #glm-5 #kimi #deepseek #qwen #llama #gemma #mistral #minimax #phi #smollm #gpt-oss #moe #on-device-ai #embedding #reranker #tts #stt #image-generation #video-generation #code-model #ollama #vllm

tech deep-dive 2026年3月28日

當 Vector Search 把名字當難度搜：RAG 系統的 Attribute Conflation 問題

查詢「美人照鏡 5.11b，推薦類似難度路線」，結果回來的全是名字像的路線而不是難度像的。根因是 dense embedding 把多個屬性壓進同一個向量，名稱的稀有性壓過了難度信號。解法：metadata pre-filter + query rewriting + score fusion 三層防線。

#rag #vector-search #embedding #cloudflare-workers #recommendation-system

ai guide RAG 系統實戰 2026年3月14日