AI 文章摘要
GitHub 上有个项目叫 ai-engineering-from-scratch,20000+ Star,标题很直白:”从零学 AI 工程”。点进去看了一眼,质量确实高——不是那种”5 分钟学会 ChatGPT”的水货,而是真正从底层讲 AI 工程化。
今天把核心内容整理一下,给想入行 AI 工程的朋友一个路线图。
AI 工程 ≠ 深度学习
很多人一听到”AI 工程”就想到训练模型、调参数、炼丹。那是 AI 研究 的活。
AI 工程的核心是:怎么把 LLM 用起来。你不需要会写 Transformer,但你需要知道怎么调 API、怎么设计 Prompt、怎么搭建 RAG、怎么部署上线。
打个比方:AI 研究者造发动机,AI 工程师造车。车不需要比发动机更难,但需要懂怎么匹配、怎么组装、怎么让车跑起来。
必学的五个模块
1. API 调用基础
第一步是学会跟 LLM API 打交道。OpenAI、Claude、豆包——接口大同小异,核心就三个参数:
- model:选哪个模型
- messages:对话历史(System + User + Assistant)
- temperature:创造性(0=严谨,1=发散)
先用 Python 的 requests 库手写一次 API 调用,理解底层原理。然后再用官方 SDK,事半功倍。
2. Prompt Engineering
这不是”写几句好话”那么简单。Prompt Engineering 是一门系统工程:
- Zero-shot:直接给任务,不给示例
- Few-shot:给几个示例,让模型照葫芦画瓢
- Chain-of-Thought:让模型一步步推理
- System Prompt 设计:定义模型的角色、约束、输出格式
关键原则:Prompt 是代码,不是文案。要版本管理、要测试、要迭代。
3. RAG(检索增强生成)
LLM 的知识截止到训练时间,而且会产生幻觉。RAG 的思路是:先检索相关文档,再让 LLM 基于文档回答。
核心流程:
- 把文档切片(Chunk),每段几百字
- 用 Embedding 模型把每段文字转成向量
- 用户提问时,用向量相似度找到最相关的几段
- 把这几段文档塞进 Prompt,让 LLM 基于它们回答
RAG 是目前企业用 LLM 最主流的方案。掌握它,能解决 80% 的实际场景。
4. Agent 与工具调用
LLM 只会”说”,不会”做”。Agent 就是让 LLM 学会”做”——它可以调用 API、执行代码、操作数据库。
核心机制是 Function Calling:你告诉 LLM 有哪些工具可以用,每个工具需要什么参数。LLM 判断什么时候该用哪个工具,输出工具调用请求,你去执行,把结果喂回来。
这是 2026 年 AI 工程最火的方向。所有 AI 产品都在往 Agent 方向靠。
5. 部署与监控
模型跑起来不难,难的是稳定地跑。需要考虑:
- 流式输出:用户不想等 10 秒才看到回复,要边生成边显示
- 限流与容错:API 调用有频率限制,要处理 429 错误
- 成本控制:GPT-4o 一次调用几毛钱,量大了很肉疼,要做缓存和模型降级
- 监控告警:响应时间变长、错误率升高,要能自动报警
学习资源推荐
除了 ai-engineering-from-scratch,这几个也值得看:
- LangChain 文档:最流行的 AI 工程框架,文档写得像教程
- OpenAI Cookbook:官方示例代码合集,覆盖各种场景
- Lilian Weng 的博客:OpenAI 研究员写的,深入浅出讲 Agent、RAG、Prompt
- Anthropic 的 Prompt 工程指南:Claude 官方出的,比 OpenAI 的更实用
给初学者的建议
别从论文开始。论文是给研究者看的,工程师不需要从头推导 Transformer。
从 API 调用开始。写一个能对话的 ChatBot,用 RAG 做一个能回答公司内部问题的助手,用 Agent 做一个能查天气的 Bot——每个项目都会让你学到新东西。
别追求完美。先让它跑起来,再优化。AI 工程的迭代速度比传统开发快得多,今天觉得”够用”的方案,下周可能就被新模型淘汰了。
2026 年是 AI 工程的黄金窗口期。早入场的人,吃到了移动互联网的红利。这次的 AI 红利,窗口也不会太长。