- 🔬
Hermes Agent 记忆架构:从 L0 到 L2 的四层设计
✅Hermes Agent 的记忆系统完整概览——系统提示词装配(L0)、持久化记忆工具(L1)、外部记忆插件(L1.5)、会话搜索(L2)、以及上下文压缩与 session 分裂。不依赖向量数据库。SQLite FTS5 + LLM 摘要 + 文件级持久化。
· Updated 5月24日 ·aiagentmemoryretrievalsearchsqlitearchitecture - 🔬
Prompt Caching 工程实践:Anthropic 的缓存设计与 defer_loading 模式
✅从 Claude Code 的 prompt caching 实践出发,整理缓存设计哲学、OpenAI/Anthropic/Google 的差异、defer_loading 占位模式。
· Updated 5月24日 ·aiagentpromptperformancesoftware engineering - 🔬
Faiss vs Chroma 向量库选型取舍
✅围绕 Faiss、Chroma 及相关向量库在 RAG / 向量检索场景中的定位差异与索引算法取舍整理。
· Updated 5月20日 ·airagretrievalvector databasefaisschromamilvusqdrantweaviatepgvectorann - 🔬
RAG 检索细节与 Pipeline 设计
✅围绕 Embedding、Reranker、Chunking、Hybrid Search、Query Transformation 等 RAG 检索细节的整理。
·airagretrievalembeddingrerankerreference - 📚
Vercel AI SDK 中的 Message 类型整理
✅记录 Vercel AI SDK 中 Message 分层、SSE 流式协议,以及实际开发时的状态管理建议。
· Updated 4月10日 ·aifrontendreacttypescriptagentreference - 🔬
Agent Routing 与多智能体成本控制
✅围绕 agent route / agent routing 的基础概念、常见实现方式,以及 multi-agent 系统里的成本控制思路整理。
· Updated 4月4日 ·aiagentmulti-agentorchestrationroutingworkflow - 🔬
Jina Embeddings API 深度解析
✅关于 Jina Embeddings 在多语言检索、长文本、Late Chunking、v4/v5 选型上的整理笔记。
· Updated 4月16日 ·airagembeddingrerankerjinaqwen - 🔬
Prompt Injection 纵深防御笔记
✅整理 OpenAI、Anthropic 与常见工程防御手段在提示词注入场景下的核心思路与面试答法。
· Updated 3月14日 ·aiagentpromptsecurity
llm
8 entries with this tag