Curated
收集好的技术博客、论文、repo — 已经读过了,整理好了,可以直接用
- 📝 blog Hermes Agent — hermes_state.py + session_search_tool.pyHermes FTS5 会话检索——搜索与理解的解耦
Hermes Agent 用 SQLite FTS5 + LLM query-focused summary 替代向量检索做会话搜索,把"召回"和"理解"拆成两个独立系统。单用户场景下比 vector RAG 更便宜、更稳、零运维。
- 📝 blog Prompt caching is everything — Lessons from building Claude CodePrompt Caching 设计哲学——缓存不是优化,是约束
从 Claude Code 的 prompt caching 实践出发,整理"动态信息放 messages 不放 system prompt"、defer_loading 模式、以及三家 LLM 厂商的缓存策略对比。对做 agent 的人来说是必读的工程纪律。
- 📄 paper UIUC / TsinghuaUseful Memories Become Faulty When Continuously Updated by LLMs
实验验证 LLM 做记忆 consolidation 的致命问题——先升后降,最终不如无记忆。episodic-only 方案持平或超越所有抽象方案。直接验证了我们之前对 Hermes Agent 记忆系统的直觉。