#self-refinement

2 篇文章

ai deep-dive 2026年6月6日

LLM Agent 的技能管理革命：從 Voyager 到 MUSE-Autoskill 的 Skill Lifecycle 全景

MUSE-Autoskill（2026）提出五階段 skill 生命週期框架，自創 skill 在 SkillsBench 達 60.35%（+7.16%），成功生成 skill 的任務上更達 87.94%，超越人工撰寫上限。本文整合六篇 arXiv 論文，梳理 skill evolution 研究全景。

#agent-skills #ai-agent #llm #self-refinement #memory #arxiv #paper-review

ai guide 2026年4月17日

Autoreason：讓 LLM 自我修正時知道何時該停手

Autoreason 用競爭式多版本評估（A/B/AB + 盲測 Borda count）取代傳統的「批評→改寫」迴圈，解決 LLM 自我修正中的提示偏差、範疇蔓延和缺乏克制三大問題。

#autoreason #nous-research #self-refinement #llm #borda-count #iterative-reasoning #ai-agent