第1章 那天,我被ChatGPT吓到了
你可能早就用过ChatGPT,也试过让AI帮你写代码。但AI Agent和这些有什么不同?为什么现在所有人都在谈Agent?这一章,我们把背景讲清楚。
1.1 你还记得第一次用ChatGPT的感觉吗?
1.1.1 惊艳过后,发现它只会说不会做
2022年11月,ChatGPT发布。很多人第一次用的时候,都被吓到了——
问它"用Python写个快速排序",它真的写出来了。
问它"帮我解释这段代码的bug",它真的能看懂。
问它"写一篇AI相关的文章",它真的写得有模有样。
那时候大家都在说:"完蛋了,程序员要失业了。"
但几年过去了,程序员没失业。因为大家很快发现了一个问题:
ChatGPT只会"说",不会"做"。
你想让它帮你订机票,它说:"抱歉,我无法直接访问互联网帮您预订机票。"
你想让它帮你整理Excel表格,它说:"您可以将文件上传到……"(然后给你的只是示例代码,并没有真正帮你处理好)。
你想让它帮你监控服务器,它说:"我无法实时访问您的服务器……"
这就是"聊天AI"的边界:它能理解你的意图,但没法替你执行动作。
1.1.2 ChatGPT是参谋,Agent是助理
AI Agent(智能体),简单说就是:
一个能理解目标、自主规划、调用工具、完成任务的AI系统。
用大白话讲:
- ChatGPT是"参谋"——你问它,它给你建议,但动作你自己做
- AI Agent是"助理"——你告诉它目标,它自己想办法完成,做完汇报结果
📖 举个例子:订机票
用ChatGPT:
你:"帮我订下周一到上海的机票"
ChatGPT:"您可以访问携程或去哪儿等网站,输入出发地、
目的地和日期,选择合适的航班后预订。"(然后你还是得自己打开网站订)
用AI Agent:
你:"帮我订下周一到上海的机票"
Agent:
1. 先查你的日历,确认下周一的日期
2. 调用航空公司API,查询可用航班
3. 根据你的偏好(便宜/直飞/时间合适)筛选
4. 弹出确认框让你审核
5. 你点"确认",它自动完成支付
6. 把行程单发到你微信(你只需要说一句话,后面都不用管了)
1.1.3 为什么是"现在"?
你可能会问:"这种助理不是说了很多年了吗?为什么是最近才火?"
三个关键技术的成熟,让AI Agent变得真正可用:
| 技术 | 之前的问题 | 现在的突破 |
|---|---|---|
| 大语言模型(LLM) | 理解能力差,容易胡说 | 现在理解复杂指令已经相当靠谱 |
| 函数调用(Function Calling) | AI只能"说",不能"做" | 现在AI能主动调用工具:搜索、查数据库、执行代码 |
| 长上下文窗口 | 记不住前面的对话 | 现在能记住几十轮对话,甚至整本书的内容 |
简单说:之前的AI像"金鱼记忆的聊天机器人",现在的AI像"能记住事情、会用工具的助理"。
1.2 已经有人在用了
1.2.1 智能客服、代码助手、数据分析
AI Agent不是"未来科技",现在已经有人在用了:
案例1:智能客服Agent
传统客服机器人:
- 用户问:"我的订单什么时候到?"
- 机器人:"请输入您的订单号。"(然后就卡死了)
AI Agent做客服:
- 从对话里自动提取用户信息(不用你手动输入订单号)
- 调用物流API查询订单状态
- 如果发现延误,主动提出补偿方案
- 如果解决不了,自动转人工,并把聊天记录摘要给人工客服看
案例2:代码助手Agent
传统代码补全工具:
- 你写一半,它给你补全下一行
- 但它不知道你的整个项目结构
AI Agent做代码助手:
- 理解你的整个项目(读取所有文件、理解架构)
- 你下指令:"帮我加一个用户登录功能"
- 它自己:分析现有代码 → 生成代码 → 写测试 → 更新文档 → 提交PR
- 你只需要Review
案例3:数据分析Agent
传统BI工具:
- 你需要懂SQL,自己写查询
- 或者找数据分析师帮你跑数据
AI Agent做数据分析:
- 你问:"上个季度哪个产品卖得最好?为什么?"
- 它自己:连接数据库 → 写SQL查询 → 生成图表 → 分析原因 → 生成报告
- 你只需要提问,它给你完整答案
1.2.2 为什么要现在开始学?
第一,软件在变。 传统软件是你操作它(点按钮、填表单、跑脚本);AI Agent软件是你告诉它目标,它操作自己。这意味着对开发者的要求变了——你需要懂怎么设计和开发Agent系统。
第二,机会在变。 招聘网站上陆续出现了AI Agent开发工程师、Agent系统架构师这些新岗位。相关岗位的薪资普遍高于传统开发岗。
第三,技术栈在变。 传统后端开发是 Python/Java + 数据库 + API;AI Agent开发是 Python + LangChain/LangGraph + 向量数据库 + LLM + Prompt工程 + 工具调用——老经验的含金量在下降,新人的机会在增加。
1.3 两条路,你选哪条?
1.3.1 本书的内容结构
这本书分为四部分、18章:
第一部分:准备篇(第1-3章)
└─ Python环境搭建 + Python核心回顾
第二部分:原理篇(第4-10章)
└─ AI Agent核心原理:推理、工具调用、记忆、规划、Multi-Agent
第三部分:进阶篇(第11-15章)
└─ 框架原理、安全评估、MCP协议、边界与架构设计
第四部分:实战篇(第16-18章)
└─ 3个企业级项目:智能客服、文档分析、代码助手
附录:面试题精选1.3.2 两条阅读路线
路线A:完整学习(推荐)
适合:Python基础不扎实,或者想系统学习AI Agent的读者
路线B:快速实战
适合:Python基础扎实,想快速上手做项目的读者
1.3.3 学习建议
建议1:代码一定要跑
这本书的每一个代码示例,都是完整可运行的。不要只是"看",要复制 → 粘贴 → 运行 → 改改看。改改参数、改改Prompt、删掉某行代码看看会报什么错——改动是最好的学习方式。
建议2:先用Mock模式,再接真实API
这本书所有项目都支持Mock模式——不用买API Key、不用连VPN,就能把代码跑通。先用Mock跑通逻辑,再接入真实的LLM API(通义千问、OpenAI、Gemini都行)。这样你不用花一分钱,就能学完所有内容。
建议3:不要跳着做项目
第四部分的3个项目,都是Day-by-Day渐进式建造的。Day 1的代码是Day 2的基础,Day 2的代码是Day 3的基础……跳着做,必卡。老老实实按顺序来。
建议4:加入交流群,别一个人死磕
这本书配套有免费的AI学习交流微信群。你遇到的问题,可能已经有其他人问过了。你卡住的地方,可能群友已经遇到过了。一个人学AI Agent,容易放弃。一群人学,能坚持下来。
1.4 本章小结
这一章,我们讲了:
- AI Agent是什么:能理解目标、自主规划、调用工具、完成任务的AI系统。ChatGPT是参谋,Agent是助理。
- 为什么是现在:LLM、函数调用、长上下文三大技术成熟,让Agent变得真正可用。
- 应用场景:智能客服、代码助手、数据分析……已经有人在用了。
- 本书的学习路径:四部分18章,从Python基础到企业落地。两条路线,任你选择。
✅ 知识点检查
学完这一章,试试回答这几个问题:
- [ ] AI Agent和普通聊天机器人最核心的区别是什么?
- [ ] 为什么AI Agent最近几年才真正火起来?哪三项技术起到了关键作用?
- [ ] 如果你Python基础不错,应该走哪条阅读路线?
- [ ] Mock模式是什么?它帮你解决了什么痛点?
📚 延伸阅读
- LangChain官方文档:https://docs.langchain.com
- 我的公众号「图解AI系列」:有更多图解教程
- 本书配套源码:关注公众号「图解AI系列」免费领取
🎯 下一章预告
第2章,我们不急着写Agent代码——
"别急,先把刀磨快。Python装不对,后面全是坑。"

