Archive Tag: llm • Joye Personal Blog

Hermes Agent 的记忆系统完整概览——系统提示词装配（L0）、持久化记忆工具（L1）、外部记忆插件（L1.5）、会话搜索（L2）、以及上下文压缩与 session 分裂。不依赖向量数据库。SQLite FTS5 + LLM 摘要 + 文件级持久化。

从 Claude Code 的 prompt caching 实践出发，整理缓存设计哲学、OpenAI/Anthropic/Google 的差异、defer_loading 占位模式。

围绕 Faiss、Chroma 及相关向量库在 RAG / 向量检索场景中的定位差异与索引算法取舍整理。

围绕 Embedding、Reranker、Chunking、Hybrid Search、Query Transformation 等 RAG 检索细节的整理。

记录 Vercel AI SDK 中 Message 分层、SSE 流式协议，以及实际开发时的状态管理建议。

围绕 agent route / agent routing 的基础概念、常见实现方式，以及 multi-agent 系统里的成本控制思路整理。

关于 Jina Embeddings 在多语言检索、长文本、Late Chunking、v4/v5 选型上的整理笔记。

整理 OpenAI、Anthropic 与常见工程防御手段在提示词注入场景下的核心思路与面试答法。