ai guide 2026年3月12日 RAG Streaming:SSE 讓 LLM 回答邊生成邊顯示 LLM 生成需要 3-5 秒,等全部生成完再顯示體驗很差。SSE 讓 token 一邊生成一邊推送,首個字元出現時間從 5 秒縮到 1 秒以內。 #rag#streaming#sse#server-sent-events#cloudflare-workers#ux