图解 LangChain 20｜Middleware 的 Hook 点：beforeModel 与 afterModel

上一篇讲了 middleware 的概念——不动核心 loop，通过钩子横切注入。这一篇落到具体：钩子长在哪、每个位置适合干什么。

核心 loop 有哪些「钩子点」

Agent 的核心 loop 是「调模型 → 判断 → 调工具 → 循环」。在这个 loop 里，有固定的几个时刻，是 middleware 可以插入的「钩子点」：

核心 loop 的钩子点

最主要的两个：

另外还有工具执行前后的钩子，但最常用的是 beforeModel 和 afterModel。这一篇重点讲这两个。

beforeModel 发生在「模型即将被调用」之前。在这个钩子里，你能拿到将要传给模型的内容（主要是 messages 列表），并在调用前修改它。

beforeModel：模型调用前改输入

这个位置适合做什么？

共同点：都是在「内容到达模型前」做预处理。

afterModel 发生在「模型已经输出」之后。在这个钩子里，你能拿到模型的输出，检查它、改它。

afterModel：模型调用后查改输出

这个位置适合做什么？

共同点：都是在「模型输出后、交给下一步前」做后处理。

beforeModel 和 afterModel 是对称的一对：一个管「进」，一个管「出」。夹在它们中间的，就是核心的模型调用。

before/after 夹住模型调用

这种对称设计让你能完整地控制「模型这一次调用」：进之前预处理（before），出之后后处理（after），中间的模型调用本身不变。

把概念落到具体。一个「记忆 middleware」就是用 beforeModel 实现的：

beforeModel(state):
    # 从某处取出历史消息
    history = load_history(state.thread_id)
    # 把历史插到要传给模型的消息前面
    state.messages = history + state.messages

每次模型要被调用前，这个 middleware 先把历史消息注入进去——模型就能「记得」之前聊过什么。这就是 Agent 记忆的核心实现机制（第 35 篇会详细讲记忆）。

记忆 middleware 的实现位置

再强调一次 middleware 的本质：它是钩子（hook），不是重写。

这种关注点分离，让你写 middleware 时只想着自己那点事（注入历史、压缩、检查），不用管整个 Agent 怎么运转。这也是 middleware 能「可组合、可复用」的根源——每个 middleware 都是独立的、专注的。

这一篇讲了 middleware 的钩子点：

下一篇讲 LangChain 提供的预置 middleware——那些最常见的横切能力，官方已经写好了，你直接用。

关于十三Tech

我是十三，All in AI Agent 方向的架构师，专注 AI 工程实践。我相信 AI 是程序员的最佳搭档。

如果你想跟完这套「图解 LangChain」，欢迎关注公众号 「十三Tech」。全系列 42 篇，会按认识基础、LangGraph 状态机、Agent 与 middleware、RAG 检索、Tools/MCP/记忆、生产化收束这条线更新。

十三Tech公众号二维码