AI 工程化 / Agent / Dify / RAG 原理大纲

这份你要建立的不是“会几个 AI 词”，而是：

模型能力为什么不能直接裸接业务 -> AI 系统为什么需要工程化 -> Agent / Dify / RAG 各自解决哪一层问题

一、总纲

这一块最核心的 6 条主线：

AI 工程化为什么存在
模型服务化和业务服务的边界
Agent 的本质
Dify 的位置
RAG 与向量数据库的本质
如何把这些挂回你的项目和研发流程

二、为什么 AI 需要工程化

核心问题

模型能力不是普通 API，它有这些特性：

不确定性更高
输出质量波动更大
成本更敏感
时延更敏感
上下文依赖更强

所以不能只做到“能调通”，还要做到：

可控
可观测
可评估
可回滚

三、模型服务化原理

1. 为什么模型服务和业务服务要分层

因为它们：

生命周期不同
资源模型不同
扩缩容方式不同
版本治理方式不同

2. 业务服务应该负责什么

参数整理
上下文拼装
调用编排
超时 / 重试 / 降级
结果落库与日志

3. 模型服务应该负责什么

推理
模型版本
资源管理

四、Prompt 工程本质

Prompt 工程不是“写几句提示词”，而是：

任务目标建模
上下文组织
约束定义
输出结构设计
异常场景处理

这也是为什么你在研发里会把 AI 用在需求拆解、单测、文档整理，而不是只做一次生成。

五、Agent 原理链

1. Agent 为什么不等于一次大模型调用

因为 Agent 至少包含：

目标
状态
工具
多步骤决策
校验
回退

2. Agent 在解决什么问题

解决多步骤任务的动态编排问题。

3. Agent 最难的地方

上下文是否充分
工具是否可靠
结果是否可验
中间状态如何管理

六、工作流和 Agent 的边界

工作流

更确定、路径固定、容易治理。

Agent

更动态、灵活，但不确定性更高。

这句话很稳

工作流偏确定性流程引擎，Agent 偏动态执行体。

七、Dify 的本质位置

Dify 在解决什么

它更像：

AI 应用编排层
原型验证层
工作流可视化层

它不适合替代什么

不适合替代：

强状态业务系统
深度定制的核心后端逻辑
复杂事务主链路

为什么

因为这些场景需要更细粒度的工程控制和服务治理。

八、RAG 原理链

1. RAG 为什么存在

因为模型本身知识不是永远最新，也容易幻觉。 RAG 通过检索把外部知识引进来。

2. RAG 的核心链路

切片
embedding
向量索引
topK 召回
重排
上下文拼装
生成

3. 真正难点

不是“接一个向量库”，而是：

知识切片质量
检索质量
上下文控制
引用约束

九、向量数据库的本质

1. 它在解决什么

语义相似检索。

2. 为什么不能替代 MySQL

因为：

MySQL 负责业务主数据
向量数据库负责语义召回

两者不是同一层。

3. 为什么也不能简单替代 ES

因为：

ES 更偏关键词 / 全文检索
向量库更偏语义检索

实际系统里可能两者并存。

十、AICG 的工程化本质

生成内容不是重点，重点是：

质量怎么控
成本怎么控
风险怎么控
审计怎么做
人工兜底怎么做

这才是 AICG 真正落地时会被问的点。

十一、结合你的项目怎么讲

海外业务平台

AI 能力在这里不是独立项目，而是要和识别、鉴定、订阅、支付、后台和归因一起协作。

研发流程

你对 AI 的实际使用更偏：

需求拆解
单测生成
文档整理
代码理解
Agent 协作

这也属于 AI 工程化落地，只是落点在研发流程而不是终端产品。

十二、你最适合的结尾表达

我对 AI 工程化、Agent、Dify 和 RAG 的理解，不是停留在概念，而是把它们放在系统分层里看。模型服务负责推理能力，业务服务负责编排和治理，Agent 负责动态任务执行，Dify 更像编排与验证层，RAG 和向量数据库负责知识召回。真正落地时，核心永远是可控、可观测、可评估。