Skip to content

第1章 那天,我被ChatGPT吓到了

你可能早就用过ChatGPT,也试过让AI帮你写代码。但AI Agent和这些有什么不同?为什么现在所有人都在谈Agent?这一章,我们把背景讲清楚。


1.1 你还记得第一次用ChatGPT的感觉吗?

1.1.1 惊艳过后,发现它只会说不会做

2022年11月,ChatGPT发布。很多人第一次用的时候,都被吓到了——

问它"用Python写个快速排序",它真的写出来了。

问它"帮我解释这段代码的bug",它真的能看懂。

问它"写一篇AI相关的文章",它真的写得有模有样。

那时候大家都在说:"完蛋了,程序员要失业了。"


但几年过去了,程序员没失业。因为大家很快发现了一个问题:

ChatGPT只会"说",不会"做"。


你想让它帮你订机票,它说:"抱歉,我无法直接访问互联网帮您预订机票。"

你想让它帮你整理Excel表格,它说:"您可以将文件上传到……"(然后给你的只是示例代码,并没有真正帮你处理好)。

你想让它帮你监控服务器,它说:"我无法实时访问您的服务器……"

这就是"聊天AI"的边界:它能理解你的意图,但没法替你执行动作。



1.1.2 ChatGPT是参谋,Agent是助理

AI Agent(智能体),简单说就是:

一个能理解目标、自主规划、调用工具、完成任务的AI系统。

用大白话讲:

  • ChatGPT是"参谋"——你问它,它给你建议,但动作你自己做
  • AI Agent是"助理"——你告诉它目标,它自己想办法完成,做完汇报结果

📖 举个例子:订机票

用ChatGPT

你:"帮我订下周一到上海的机票"
ChatGPT:"您可以访问携程或去哪儿等网站,输入出发地、
目的地和日期,选择合适的航班后预订。"

(然后你还是得自己打开网站订)

用AI Agent

你:"帮我订下周一到上海的机票"
Agent:
  1. 先查你的日历,确认下周一的日期
  2. 调用航空公司API,查询可用航班
  3. 根据你的偏好(便宜/直飞/时间合适)筛选
  4. 弹出确认框让你审核
  5. 你点"确认",它自动完成支付
  6. 把行程单发到你微信

(你只需要说一句话,后面都不用管了)


1.1.3 为什么是"现在"?

你可能会问:"这种助理不是说了很多年了吗?为什么是最近才火?"

三个关键技术的成熟,让AI Agent变得真正可用:

技术之前的问题现在的突破
大语言模型(LLM)理解能力差,容易胡说现在理解复杂指令已经相当靠谱
函数调用(Function Calling)AI只能"说",不能"做"现在AI能主动调用工具:搜索、查数据库、执行代码
长上下文窗口记不住前面的对话现在能记住几十轮对话,甚至整本书的内容

简单说:之前的AI像"金鱼记忆的聊天机器人",现在的AI像"能记住事情、会用工具的助理"。


1.2 已经有人在用了

1.2.1 智能客服、代码助手、数据分析

AI Agent不是"未来科技",现在已经有人在用了

案例1:智能客服Agent

传统客服机器人

  • 用户问:"我的订单什么时候到?"
  • 机器人:"请输入您的订单号。"(然后就卡死了)

AI Agent做客服

  1. 从对话里自动提取用户信息(不用你手动输入订单号)
  2. 调用物流API查询订单状态
  3. 如果发现延误,主动提出补偿方案
  4. 如果解决不了,自动转人工,并把聊天记录摘要给人工客服看

案例2:代码助手Agent

传统代码补全工具

  • 你写一半,它给你补全下一行
  • 但它不知道你的整个项目结构

AI Agent做代码助手

  1. 理解你的整个项目(读取所有文件、理解架构)
  2. 你下指令:"帮我加一个用户登录功能"
  3. 它自己:分析现有代码 → 生成代码 → 写测试 → 更新文档 → 提交PR
  4. 你只需要Review

案例3:数据分析Agent

传统BI工具

  • 你需要懂SQL,自己写查询
  • 或者找数据分析师帮你跑数据

AI Agent做数据分析

  1. 你问:"上个季度哪个产品卖得最好?为什么?"
  2. 它自己:连接数据库 → 写SQL查询 → 生成图表 → 分析原因 → 生成报告
  3. 你只需要提问,它给你完整答案

1.2.2 为什么要现在开始学?

第一,软件在变。 传统软件是你操作它(点按钮、填表单、跑脚本);AI Agent软件是你告诉它目标,它操作自己。这意味着对开发者的要求变了——你需要懂怎么设计和开发Agent系统。

第二,机会在变。 招聘网站上陆续出现了AI Agent开发工程师、Agent系统架构师这些新岗位。相关岗位的薪资普遍高于传统开发岗。

第三,技术栈在变。 传统后端开发是 Python/Java + 数据库 + API;AI Agent开发是 Python + LangChain/LangGraph + 向量数据库 + LLM + Prompt工程 + 工具调用——老经验的含金量在下降,新人的机会在增加。


1.3 两条路,你选哪条?

1.3.1 本书的内容结构

这本书分为四部分、18章

第一部分:准备篇(第1-3章)
  └─ Python环境搭建 + Python核心回顾

第二部分:原理篇(第4-10章)
  └─ AI Agent核心原理:推理、工具调用、记忆、规划、Multi-Agent

第三部分:进阶篇(第11-15章)
  └─ 框架原理、安全评估、MCP协议、边界与架构设计

第四部分:实战篇(第16-18章)
  └─ 3个企业级项目:智能客服、文档分析、代码助手

附录:面试题精选

1.3.2 两条阅读路线

路线A:完整学习(推荐)

适合:Python基础不扎实,或者想系统学习AI Agent的读者

路线B:快速实战

适合:Python基础扎实,想快速上手做项目的读者


1.3.3 学习建议

建议1:代码一定要跑

这本书的每一个代码示例,都是完整可运行的。不要只是"看",要复制 → 粘贴 → 运行 → 改改看。改改参数、改改Prompt、删掉某行代码看看会报什么错——改动是最好的学习方式

建议2:先用Mock模式,再接真实API

这本书所有项目都支持Mock模式——不用买API Key、不用连VPN,就能把代码跑通。先用Mock跑通逻辑,再接入真实的LLM API(通义千问、OpenAI、Gemini都行)。这样你不用花一分钱,就能学完所有内容。

建议3:不要跳着做项目

第四部分的3个项目,都是Day-by-Day渐进式建造的。Day 1的代码是Day 2的基础,Day 2的代码是Day 3的基础……跳着做,必卡。老老实实按顺序来。

建议4:加入交流群,别一个人死磕

这本书配套有免费的AI学习交流微信群。你遇到的问题,可能已经有其他人问过了。你卡住的地方,可能群友已经遇到过了。一个人学AI Agent,容易放弃。一群人学,能坚持下来。


1.4 本章小结

这一章,我们讲了:

  1. AI Agent是什么:能理解目标、自主规划、调用工具、完成任务的AI系统。ChatGPT是参谋,Agent是助理。
  2. 为什么是现在:LLM、函数调用、长上下文三大技术成熟,让Agent变得真正可用。
  3. 应用场景:智能客服、代码助手、数据分析……已经有人在用了。
  4. 本书的学习路径:四部分18章,从Python基础到企业落地。两条路线,任你选择。

✅ 知识点检查

学完这一章,试试回答这几个问题:

  • [ ] AI Agent和普通聊天机器人最核心的区别是什么?
  • [ ] 为什么AI Agent最近几年才真正火起来?哪三项技术起到了关键作用?
  • [ ] 如果你Python基础不错,应该走哪条阅读路线?
  • [ ] Mock模式是什么?它帮你解决了什么痛点?

📚 延伸阅读

  • LangChain官方文档:https://docs.langchain.com
  • 我的公众号「图解AI系列」:有更多图解教程
  • 本书配套源码:关注公众号「图解AI系列」免费领取

🎯 下一章预告

第2章,我们不急着写Agent代码——

"别急,先把刀磨快。Python装不对,后面全是坑。"