大模型应用架构设计要点之安全篇

发表于2026-04-26

|浏览量:

去年年底开始，我就常和人发生这样的对话：

你们这个智能体应用的底层大模型是自己做的吗? — 不是，我们用的XXX

你们是做了微调？—没有呢，基模迭代太快，做微调不现实

哦，那你们就是拿XXXX的API套了个壳啊！ — （无语）

当然，我们不能苛求外行人士去弄懂 DeepSeek API 和 DeepSeek 网页版的区别，他们不知道部署个DeepSeek-V3 不代表拥有了DeepSeek网页版对话应用。转而言之，也不是没有在基模层面做调整就无法形成自己软件产品的核心竞争力。别人说大模型应用是基模API套壳，自己不能真信了，事实上大模型应用相较传统软件应用在架构上更为复杂。

但也由此，触动我去总结大模型应用架构设计的要点，与各位一起探讨进步。

架构设计的目的简而言之就是解决安全、性能、可扩展性这三个问题，因此我也打算分三篇来总结，这是第一篇：安全篇。

下面我就从内容安全、运行安全和数据安全三个角度来阐述。

内容安全

传统类软件在处理内容安全时非常简单，但是大模型对话类应用会复杂许多。事实上，直到现在，网络上关于大模型越狱还是很火的话题，不少人致力于通过提示词注入有意让大模型去生成不当、不妥的内容。

即使不提涉H涉Z的内容，作为一个大模型应用，如果反馈给用户的内容，超出了应用的边界，也属于安全失控，比如健康管理类的应用直接给咨询者出具了诊断或开立了处方或者大模型应用将置信度不足的内容返回给了用户，从而造成了明显的误导。

解决内容安全问题，重点就是解决注入和越界问题，架构设计时需要做到以下三点：

前置拦截器。前置拦截器一般是通过一个网关来实现。在收到用户的 query 之后，递交给 LLM 之前，要对 query 内容进行语义识别，可以是关键词结合分类小模型，为query打上标签：暴力、涉政、代码注入等等。如果是恶意类的标签，网关直接阻断请求并返回预设回复，这样也能使得大模型的token免遭浪费。
提示词锁定。为了避免恶意用户覆写大模型角色，导致应用失控，在前端请求到达网关层时，需要强制拼装一段不可见、不可覆盖的系统级Prompt，限定其身份边界，比如你是一个健康管家助手，拒绝回答医学诊断问题……。
后置判别器。大模型应用的返回方式可能是一次性的也可能是流式的。无论是一次性输出还是流式输出，都需要对返回内容进行判定。比如采用SSE时，旁路要并行运行一个判别器模型。一旦检测到正在输出的 Token 组合触碰红线（例如生成了带有严重错误的临床辅助建议），架构上要立即触发掐断机制，直接回复给前端：生成已中止。

运行安全

传统软件的运行安全主要是考虑保护服务器性能，在适当的时候熔断或降级。大模型应用的运行安全，需要在CPU、连接数这些之外，再额外考虑token负载，无论用户是有意或是无意，造成token异常大量消耗时，架构上应有控制点发挥作用。

为了避免运行时的崩溃与耗尽，架构设计时需要考虑以下三个方面：

LLM限流。在大模型应用架构中，需要实时计算每个会话的 Token 消耗，比如每分钟token数，将其写入Redis中，当某个会话的token消耗速率过高时，大模型应用的模型路由层要能自动将用户请求从高参数模型降级到低延迟低成本的模型或者通过阻断用户请求进行流控（显式返回给用户告知其操作过于频繁，请X分钟之后再提问），从而保障系统整体平稳，当然整个过程中可以将用户根据业务价值进行优先级分级，不用一刀切。
断路器。对于涉及多步推理的智能体工作流，架构设计时要考虑最大思考步数和最大执行时间。一旦模型陷入死循环或不断重试错误的 MCP 调用，系统要强制中断，防止计算资源被无限榨干。
隔离沙箱。这一点最早是 ChatGPT 提出的，比如用户上传了一个 csv 文件给 ChatGPT 让它统计分析某个指标，事实上 LLM 会生成一段使用 pandas 库读取该 csv 文件，然后使用numpy进行计算的 Python 代码，这段代码不会在宿主机上执行，而是会迅速拉起一个微型虚拟机，然后在其中执行代码，执行完毕后即销毁该虚拟机，这样的目的是避免影响宿主机，防止恶意代码被执行。比如用户说请删除服务器目录下的所有文件，即使这句话绕过了拦截器，也只是在沙箱中删除不会造成损失。如果大模型应用中涉及到数据分析、准确的数学计算、格式转化等等此类需要通过生成代码并执行代码的场景，需要在系统设计中实现沙箱机制。

数据安全

前一段时间有个新闻，说的是用户在使用Kimi的时候竟然看到了其他用户上传的简历。月之暗面解释说是模型幻觉导致的，但幻觉不至于让一份完整的准确的简历给另一个用户看到，这大概率是生产环境数据未做有效隔离或者上下文缓存错误引用导致的，这是一个工程问题，不是基模幻觉问题。

要作好数据安全隔离，需要着重实现以下三点：

租户会话二级隔离。会话在持久化存储时需要明确标识租户信息，前端在发起请求时只允许携带本轮会话标识，历史会话标识一定要由后端服务通过租户ID关联取出，这样可以避免前端恶意读取跨会话\跨租户内容。
向量库数据权限隔离。大模型应用一般都会通过向量库实现RAG。如果特定用户的数据被切片放入向量库时未附带权限信息，后期检索召回时则无法控制数据不被不当利用。以Qdrant为例，每个向量都可以关联一个 JSON 格式的 Payload。在存储切片时，需要将权限标识作为字段存入。在检索时，调用 search 接口必须将当前会话租户的权限信息通过 filter 参数传入。这样 Qdrant 就会在进行向量相似度计算前执行过滤，只有符合条件的向量才会参与距离计算。
敏感信息过滤器。大模型应用在架构设计时，需要实现一个filter，在数据即将提交给用户前，利用正则表达式或小模型，对身份证、电话号码、真实姓名等敏感信息进行动态掩码或替换。

结语

当大模型由专业的厂商来开发和迭代后，使用大模型去实现应用与使用一个关系数据库去实现应用并无本质不同。它们都是一个组件。我们需要根据这个组件的能力边界、关键特性去使用好它，这也就是架构师的职责所在。

文章作者: LeFer

文章链接: https://www.lefer.cn/posts/52826/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 LeFer！

相关推荐

我为什么不用DDD

Domain-driven design并不是一个新鲜的东西，从 2004 年Eric Evans提出这个理念以来，十几年间时不时就有一股DDD的热潮，近几年随着微服务的大行其道，DDD又成了宠儿。但终究逃不过雷声大雨点小。领域驱动设计最根本的思路是一套自上而下的设计方法，即从要解决的问题领域或系统目标出发，由业务和架构专家一起，对复杂的业务场景和关联性进行分组归类，形成一个一个相对单一职责的子领域。子领域和子领域之间要有明确的界限。在子领域内部，再通过业务上的模型去归类对应的属性和行为。从设计思想上看，我非常赞同自上而下的架构设计理念，也在不断践行。但今天在技术圈里流传的DDD早已超出了上述的定义，而变成了一套以充血模型为基础，围绕聚合根，并通过门面代理、分离查询、事件传播等手段的软件架构方法。通过这种构建，想达成三种目的：统一语言：业务与技术统一让行为回归到实体中去降低传统service层的复杂度我所不采纳的即是这样一种“术”，有三个主要原因。行为是变化的，对象的表达却是几乎不变的，将变化的与不变的聚合在一起，违反了动静分离的原则。软件实现的是策略，...

一篇文章说清楚AI原生架构（AI Native）

引言大家好，最近openClaw大爆，不少软件/服务都纷纷迭代，提供了CLI或MCP，供各类龙虾、螃蟹以及其他海鲜水产接入（开个玩笑）。我前面写过一篇文章，呼吁各位同仁警惕马车陷阱，不要用AI能力去做了一堆旧式马车出来。同时，我也在思考研究AI时代的软件究竟应该是什么形态，难道就是openClaw这样吗？当然，这个命题实在很大，我个人能力也特别有限，而且其实也还未到能说清楚的时候（子弹还得飞一会），但是从底层技术哲学的角度来看，整体的框架还是有轮廓的，于是我尝试用这篇文章将我的思考写出来，尝试说清楚AI原生架构到底是什么，什么样，能解决什么问题，以及与传统软件架构的关系，也欢迎讨论指正。首先，AI Native是什么如果用严肃的语言去描述，AI Native 可以定义为：以大模型作为底层的推理内核与控制逻辑中枢，实现业务流程的编排与交互的语义化，并具备进化能力的软件或系统。AI Native应用区别于集成了AI功能或外挂了AI能力的应用，比如腾讯会议最近提供了AI会议纪要功能（很棒的功能），但腾讯会议app不是AI Native应用。要深刻理解AI Native，只需...

全球智能危机(第一部分:Agentic AI的兴起)

最近有两篇文章在国外金融圈和 X 上引发巨大讨论，甚至短暂导致部分软件股和相关股票出现明显波动。题为《The Global Intelligence Crisis（全球智能危机）》，其作者是 Alap Shah 与 Citrini 。Alap Shah具备多年的AI行业创业及投资经验，他创立的一家 AI 驱动的金融搜索和信息平台公司以超过2亿美元的价格被竞争对手收购，Citrini Research 是一家专注于主题股权投资和全球宏观交易的独立研究机构。这篇文章不是科幻小说，而是基于作者在 AI 公司建设和公共市场投资的20年经验，对即将到来的经济风暴的深刻剖析。本文是对《The Global Intelligence Crisis》的第一篇《 Part 1. Part One–The Rise of Agentic AI 》主要观点的归纳，以便各位读者快速了解行业顶级洞见。核心观点人类智能一直是经济系统的稀缺资源，但2026年起，AI代理（Agentic AI）的爆发将颠覆这一前提，导致白领认知劳动大规模被取代。如果不采取政策干预，这可能引发一场金融危机。引言：A...

AI热潮中的冷思考

「大爷，您听说过词元吗？就是是最近央视报道、国家宣传的，它是AI 时代的石油、是数字黄金、是下一个比特币。现在有一门稳赚不赔的投资您感兴趣吗——低价囤词元，未来涨百倍」（误，不要信）这是这两天我在一个防诈宣传上看到它列举的典型案例。AI真的太热了，骗子都可以用这个概念骗大爷大妈了。而你——我的同行们——你既然看到这篇文章，你要么在忙着用大模型重构业务，要么在忙着折腾小龙虾…当你从demo阶段转到实战阶段的时候，你一定已经遇到了一个又一个坑，从刚开始的兴奋不已到困惑不解，为什么不如预期呢？甚至产生了一丝丝怀疑，到底是我不行还是大模型不行？以小龙虾为例，当它在处理未见过的UI布局时（是的，企业环境里有大量的非公开的UI），效率和准确性会雪崩式的下降，偶尔会陷入“失败-重试”的反复循环，token像流水一样逝去，最终只为了完成一次简单的点击；即使不是模拟操作UI，只是生成一个报表或者月度报告，你敢不敢直接点击“发送”呢？它的确一分钟生成好了，但你要花费十倍的时间去检查验证；更加让人不放心的是，它不理解“删除正式文件”和“删除临时文件”的区别，不加分辨的使用你授予的权限，然后造成悔之...

全球智能危机(第二部分:一场来自未来的金融史思想实验)

这篇文章是全球智能危机的第二部分，副标题为一场来自未来的金融史思想实验，这部分不同于 Part One 的分析式论述，而是采用一种虚构的“未来回顾”叙事形式：假装是 Citrini Research 在 2028 年 6 月发布的宏观备忘录，回顾“全球智能危机”如何从 2026 年起逐步爆发并演变为一场全面金融/经济灾难。以下是全文翻译。序言如果我们对 AI 的长期看多是正确的……但如果这反而是利空呢？接下来的内容是一个情境模拟，而非预测。这不是“空头意淫”或“AI 灭世幻想”。本文的唯一目的是建模一个相对未被充分探讨的情境。我们的朋友 Alap Shah 提出了这个问题，我们共同构思了答案。希望阅读此文能让您更好地应对随着 AI 让经济变得日益诡异而可能出现的“左尾风险”。这是来自 2028 年 6 月的 CitriniResearch 宏观备忘录，详细记录了“全球智能危机”的演变与后果。宏观备忘录智力过剩的后果 (The Consequences of Abundant Intelligence)CitriniResearch 模拟日期：202...

从“被AI替代”到“驾驭AI”的超级个体路线图

作为一名在技术圈摸爬滚打二十年的老兵，我最近在面试和团队管理中发现了一个有趣的现象：技术的门槛正在崩塌，但职业的护城河却在变深。现在的职场存在一种普遍的错觉：很多人觉得注册了 ChatGPT、DeepSeek，学会了几句“提示词（Prompt）”，就算是拥抱 AI 了。但在我看来，这只是停留在了“玩具阶段”。真正且深刻的变革正在水面之下发生——我们正处于从“人机对话”向“智能体协作（Agentic Workflow）”转型的关键节点。 2026 年的职场，不会淘汰那些不懂复杂代码的人，但会淘汰那些缺乏“AI 编排力”的人。对于非技术背景的专业人士来说，你们不需要成为程序员，但必须成为自己工作流的“系统架构师”。以下是我基于行业趋势，为致力于构建核心竞争力的专业人士梳理的一份转型路线图。 -—————————————————- 一、认知重塑：从“T型”人才向“Π型”人才进化过去我们推崇“T型人才”（一专多能），但在 AI 时代，这个模型正在失效。为什么？因为 AI 最擅长的就是“广度”。它可以瞬间填补你原本引以为傲的那个“横向”知识面。如果你的核心竞争力仅仅是“什么都懂一...

评论