跳至内容

卡帕西知识库 vs RAG · 两种记忆的哲学

Karpathy Knowledge Base vs. RAG — two philosophies of memory
2026年4月22日
卡帕西知识库 vs RAG · 两种记忆的哲学
赵博

2024 年,Andrej Karpathy 发了一条推文,几乎是在抬杠 RAG:
"下一代 LLM 产品不会靠 RAG 解决一切,而是让模型把知识内化,像一个真正的专家。"
两年过去,这个争论并没有收场 —— 而是变成了企业 AI 系统架构师每天都要做的选择题:什么知识该扔给 RAG,什么知识该教给模型本身。

图一 · 两种记忆哲学 · 外挂检索 vs 内化训练
图一 · 两种记忆哲学 · 外挂检索 vs 内化训练

一 · RAG · The Library Approach 外挂的图书馆

RAG (Retrieval-Augmented Generation) 的思路非常直白 —— 把你的知识分块、向量化、塞进向量库。用户问问题的时候先去向量库里找相关片段,拼到 prompt 里一起喂给 LLM。

图二 · RAG · 图书馆里的书,每一本都贴了编号,需要时调出来
图二 · RAG · 图书馆里的书,每一本都贴了编号,需要时调出来

这套架构的优点几乎写在了教科书里:

  • 知识随时更新 —— 改一条向量就能改答案,不用重新训练。
  • 引用可追溯 —— 给出答案时可以附带来源链接,合规、可审计。
  • 成本可控 —— 向量检索便宜,LLM 本身不动。
  • 隔离清晰 —— 多租户、部门知识库都能按权限过滤。

它的痛点也很清楚:能告诉模型"事实",但无法告诉它"风格"和"品味"。RAG 把一本《红楼梦》喂进向量库,模型回答时可以引用原文,但你让它"写一段曹雪芹风格的新章节",它还是不会。

二 · Karpathy KB · The Internalized Approach 内化的专家

图三 · Karpathy KB · 知识写进神经网络的权重里
图三 · Karpathy KB · 知识写进神经网络的权重里

卡帕西知识库 (Karpathy Knowledge Base) 的核心主张:真正好用的企业 AI,应该像一个读了你们公司所有资料的新员工 —— 他不是每次都去查档案柜,而是这些知识已经在他脑子里,能用公司的语气说话,能识别内部黑话,能在第一次听到一个缩写时就知道它是什么。

实现路径有三条:

  • 继续预训练 (Continued Pre-training) —— 在基础模型之上,用企业自己的文档做下一轮训练。
  • LoRA / QLoRA 微调 —— 轻量级权重插件,几小时就能把一批风格样本"嵌"进模型。
  • System prompt 沉淀 —— Karpathy 最喜欢讲的路径,把大量 context 稳定写进 system prompt,配合 prompt caching 把 token 成本压到极低。
RAG 给你"能查"的记忆,Karpathy KB 给你"能懂"的记忆。
RAG gives retrievable memory. Karpathy KB gives native fluency.

三 · 对比矩阵 When to Use Which

图四 · 每个场景,都有它更合适的那把钥匙
图四 · 每个场景,都有它更合适的那把钥匙
维度RAG · 外挂图书馆Karpathy KB · 内化专家
知识更新频率分钟级按周/月重训
风格/语气保留
引用可追溯天然带 cite需要额外设计
训练/部署成本中-高
推理 token 消耗高 (上下文拼接)低 (已内化)
适合的知识类型事实、数据、法规、手册品牌语气、经验、直觉
幻觉控制靠检索边界靠训练质量

四 · 真实场景判断法 Field Rules

→ 用 RAG 的场景

  • 法律 · 医疗 · 金融合规 —— 每条结论必须能指回原文条款。
  • 产品手册 / API 文档 —— 版本更替频繁,重训不现实。
  • 客服知识库 —— 每天都在新增 FAQ。
  • 多租户 SaaS —— 不同客户隔离自己的数据。

→ 用 Karpathy KB 的场景

  • 品牌文案助手 —— 需要把你们公司十年来的文案风格继承下来。
  • 专业顾问机器人 —— 需要"经验直觉",不能像学生翻书那样查。
  • 行业 DSL / 专有语言 —— 内部框架、配置语言,希望模型一次就能写对。
  • 小语种 / 稀有领域 —— 基础模型不熟,RAG 拼 context 也救不了。

五 · 辉火云管家的混合架构 OpenClaw Hybrid

OpenClaw · 辉火云管家 里,我们选择了一个分层的混合架构:

  • Layer 1 · 基础模型 — Claude / DeepSeek / Qwen,提供通用能力。
  • Layer 2 · 行业 KB (Karpathy 式) — Odoo / ERP / MES / 质检知识,通过 system prompt + prompt caching 稳定注入 8K-32K token。
  • Layer 3 · 企业 RAG — 客户的产品目录、工单历史、供应商名录,实时向量检索。
  • Layer 4 · 会话 memory — 当前会话的短期上下文 + 长期决策日志。
不是"RAG 好还是 Karpathy KB 好",而是"哪一层给哪一种记忆"。
—— 这是一个架构问题,不是路线之争。
想看看 OpenClaw 怎么把这四层知识编织起来?
一次完整的企业 AI 架构咨询 · 我们来讲。
了解 OpenClaw →

— 青岛火一五信息科技 · 2026 年 4 月 —

爱马仕和龙虾的不同
为什么人类要的是掌控感,而不是非常聪明