建立共同语言
先补齐模型、数据、Token、上下文、Embedding 和推理的基本概念。
能判断一个 AI 需求大概需要哪类能力。
进入此阶段Roadmap
这四步不是课程章节,而是判断学习优先级的坐标。每一步都应该产出一个能被复盘的结果。
先补齐模型、数据、Token、上下文、Embedding 和推理的基本概念。
能判断一个 AI 需求大概需要哪类能力。
进入此阶段从聊天走向 Prompt 结构、API 调用、结构化输出和错误处理。
能做一个可演示的模型调用小工具。
进入此阶段学习 RAG、工具调用和轻量工作流,让模型接入真实上下文。
能把私有资料或业务工具接进 AI 应用。
进入此阶段补上评测、观测、成本、安全和部署,让应用可持续改进。
能为 AI 应用设计上线检查清单。
进入此阶段Paths
如果不知道先学哪条,就从第一条开始。已经在做项目的读者可以直接跳到 RAG 或 Agent 路线。
补齐机器学习、大模型、Prompt、Embedding 和 API 调用的共同语言。
先理解模型、Token、上下文窗口和 Embedding,避免只会背工具名。
知道 LLM 输入输出的基本约束。
能用自己的话解释模型、Token、上下文窗口和 Embedding。
从普通提问进入结构化提示、格式约束和 API 调用。
把模型当作可组合的软件能力使用。
能设计一个返回 JSON 的提示词,并解释失败时该查什么。
把模型调用接入一个实际任务,而不是停留在聊天窗口。
完成从需求、输入、调用、输出到错误处理的小闭环。
能做出一个摘要、分类、问答或资料整理的可演示原型。
围绕检索、切分、向量化、重排和评测建立知识库应用能力。
先把加载、切分、索引、召回和生成的边界拆清楚。
知道 RAG 不是把文档塞进模型,而是信息检索和生成的组合。
能画出一个最小 RAG 流程图,并标注每一步的输入输出。
比较向量检索、关键词检索、混合检索和重排的使用边界。
能根据文档形态和问题类型选择检索策略。
能解释为什么某个问题没有召回正确上下文。
用真实问题、期望答案和引用片段判断系统是否变好。
避免只凭单次演示判断 RAG 质量。
能维护一组回归问题,并比较两版检索策略的差异。
学习工具调用、多步骤任务、评测观测、成本控制和部署边界。
不要一上来追求自主 Agent,先把模型调用外部工具的接口做稳。
理解工具 schema、权限和执行结果如何影响模型行为。
能实现一个带工具调用的受控任务流程。
把规划、执行、观察、修正拆成可记录的状态流。
让复杂任务可以复盘,而不是只看到最终回答。
能描述一个 Agent trace,并指出每步失败点。
用评测、观测、成本和安全策略约束 Agent 的真实运行。
把 Agent 从 demo 变成可监控、可回滚、可改进的系统。
能列出上线前必须检查的评测集、日志、权限和成本指标。
Audience
不同读者需要的深度不同。先选对优先级,比把所有材料从头刷一遍更重要。
重点理解能力边界、场景判断和工作流改造,不需要先陷入框架细节。
重点把模型接入真实产品:API、结构化输出、RAG、工具调用和错误处理。
重点关注系统可靠性:观测、评测、成本、安全、部署和多模型治理。
Topics
这些主题构成从“会用模型”到“能做系统”的骨架。每个主题都能继续拆成知识条目、资源和开源项目。
理解模型如何接收上下文、生成输出,以及能力边界为什么会变化。
把自然语言请求变成可复用、可测试、可接入系统的调用方式。
学习如何把文本转成可比较的表示,并用检索找回相关上下文。
把私有资料、业务文档和模型生成连接起来,形成可调试的知识应用。
让模型调用外部工具和执行多步骤任务,同时保持权限和状态可控。
用数据判断系统是否变好,并持续控制质量、延迟、费用和风险。
Next
学习路线负责确定顺序,具体材料分散在站内其他栏目。按当前问题选择入口即可。