AI 工程化 / Agent / Dify / RAG 原理大纲

这份你要建立的不是“会几个 AI 词”,而是:

模型能力为什么不能直接裸接业务 -> AI 系统为什么需要工程化 -> Agent / Dify / RAG 各自解决哪一层问题

一、总纲

这一块最核心的 6 条主线:

  1. AI 工程化为什么存在
  2. 模型服务化和业务服务的边界
  3. Agent 的本质
  4. Dify 的位置
  5. RAG 与向量数据库的本质
  6. 如何把这些挂回你的项目和研发流程

二、为什么 AI 需要工程化

核心问题

模型能力不是普通 API,它有这些特性:

  • 不确定性更高
  • 输出质量波动更大
  • 成本更敏感
  • 时延更敏感
  • 上下文依赖更强

所以不能只做到“能调通”,还要做到:

  • 可控
  • 可观测
  • 可评估
  • 可回滚

三、模型服务化原理

1. 为什么模型服务和业务服务要分层

因为它们:

  • 生命周期不同
  • 资源模型不同
  • 扩缩容方式不同
  • 版本治理方式不同

2. 业务服务应该负责什么

  • 参数整理
  • 上下文拼装
  • 调用编排
  • 超时 / 重试 / 降级
  • 结果落库与日志

3. 模型服务应该负责什么

  • 推理
  • 模型版本
  • 资源管理

四、Prompt 工程本质

Prompt 工程不是“写几句提示词”,而是:

  • 任务目标建模
  • 上下文组织
  • 约束定义
  • 输出结构设计
  • 异常场景处理

这也是为什么你在研发里会把 AI 用在需求拆解、单测、文档整理,而不是只做一次生成。


五、Agent 原理链

1. Agent 为什么不等于一次大模型调用

因为 Agent 至少包含:

  • 目标
  • 状态
  • 工具
  • 多步骤决策
  • 校验
  • 回退

2. Agent 在解决什么问题

解决多步骤任务的动态编排问题。

3. Agent 最难的地方

  • 上下文是否充分
  • 工具是否可靠
  • 结果是否可验
  • 中间状态如何管理

六、工作流和 Agent 的边界

工作流

更确定、路径固定、容易治理。

Agent

更动态、灵活,但不确定性更高。

这句话很稳

工作流偏确定性流程引擎,Agent 偏动态执行体。


七、Dify 的本质位置

Dify 在解决什么

它更像:

  • AI 应用编排层
  • 原型验证层
  • 工作流可视化层

它不适合替代什么

不适合替代:

  • 强状态业务系统
  • 深度定制的核心后端逻辑
  • 复杂事务主链路

为什么

因为这些场景需要更细粒度的工程控制和服务治理。


八、RAG 原理链

1. RAG 为什么存在

因为模型本身知识不是永远最新,也容易幻觉。 RAG 通过检索把外部知识引进来。

2. RAG 的核心链路

  • 切片
  • embedding
  • 向量索引
  • topK 召回
  • 重排
  • 上下文拼装
  • 生成

3. 真正难点

不是“接一个向量库”,而是:

  • 知识切片质量
  • 检索质量
  • 上下文控制
  • 引用约束

九、向量数据库的本质

1. 它在解决什么

语义相似检索。

2. 为什么不能替代 MySQL

因为:

  • MySQL 负责业务主数据
  • 向量数据库负责语义召回

两者不是同一层。

3. 为什么也不能简单替代 ES

因为:

  • ES 更偏关键词 / 全文检索
  • 向量库更偏语义检索

实际系统里可能两者并存。


十、AICG 的工程化本质

生成内容不是重点,重点是:

  • 质量怎么控
  • 成本怎么控
  • 风险怎么控
  • 审计怎么做
  • 人工兜底怎么做

这才是 AICG 真正落地时会被问的点。


十一、结合你的项目怎么讲

海外业务平台

AI 能力在这里不是独立项目,而是要和识别、鉴定、订阅、支付、后台和归因一起协作。

研发流程

你对 AI 的实际使用更偏:

  • 需求拆解
  • 单测生成
  • 文档整理
  • 代码理解
  • Agent 协作

这也属于 AI 工程化落地,只是落点在研发流程而不是终端产品。


十二、你最适合的结尾表达

我对 AI 工程化、Agent、Dify 和 RAG 的理解,不是停留在概念,而是把它们放在系统分层里看。模型服务负责推理能力,业务服务负责编排和治理,Agent 负责动态任务执行,Dify 更像编排与验证层,RAG 和向量数据库负责知识召回。真正落地时,核心永远是可控、可观测、可评估。