Learning Map

从零到能落地 AI 应用的学习地图

面向中文读者整理 AI 学习顺序:先建立概念框架,再掌握模型调用、RAG、Agent、评测和工程落地。

01建立共同语言
02会用模型做事
03连接知识与工具
04进入生产闭环

Roadmap

四个阶段建立学习节奏

这四步不是课程章节,而是判断学习优先级的坐标。每一步都应该产出一个能被复盘的结果。

01

建立共同语言

先补齐模型、数据、Token、上下文、Embedding 和推理的基本概念。

模型与推理TokenEmbedding上下文窗口

能判断一个 AI 需求大概需要哪类能力。

进入此阶段
02

会用模型做事

从聊天走向 Prompt 结构、API 调用、结构化输出和错误处理。

PromptAPI结构化输出人工复核

能做一个可演示的模型调用小工具。

进入此阶段
03

连接知识与工具

学习 RAG、工具调用和轻量工作流,让模型接入真实上下文。

RAG检索工具调用工作流

能把私有资料或业务工具接进 AI 应用。

进入此阶段
04

进入生产闭环

补上评测、观测、成本、安全和部署,让应用可持续改进。

EvalsTracing成本控制权限审计

能为 AI 应用设计上线检查清单。

进入此阶段

Paths

三条主线按顺序推进

如果不知道先学哪条,就从第一条开始。已经在做项目的读者可以直接跳到 RAG 或 Agent 路线。

入门3-4 周

AI 基础到应用入门

补齐机器学习、大模型、Prompt、Embedding 和 API 调用的共同语言。

适合谁
第一次系统学习 AI,或希望补齐概念框架的读者。
学完能做什么
能判断模型能力边界,并完成一个可解释的小型 AI 应用。

建立共同语言

先理解模型、Token、上下文窗口和 Embedding,避免只会背工具名。

知道 LLM 输入输出的基本约束。

能用自己的话解释模型、Token、上下文窗口和 Embedding。

模型、参数与推理Token 与上下文窗口Embedding 与相似度训练、微调与调用的区别

会让模型稳定输出

从普通提问进入结构化提示、格式约束和 API 调用。

把模型当作可组合的软件能力使用。

能设计一个返回 JSON 的提示词,并解释失败时该查什么。

Prompt 结构结构化输出函数和工具调用基础安全边界

做一个小应用

把模型调用接入一个实际任务,而不是停留在聊天窗口。

完成从需求、输入、调用、输出到错误处理的小闭环。

能做出一个摘要、分类、问答或资料整理的可演示原型。

任务拆解输入清洗错误处理人工复核
进阶4-5 周

RAG 与知识库应用

围绕检索、切分、向量化、重排和评测建立知识库应用能力。

适合谁
已经会调用模型,想把私有文档、业务知识或长文本接入 AI 应用的开发者。
学完能做什么
能设计一个可调试、可评测的 RAG 原型,并知道什么时候不该用 RAG。

理解检索链路

先把加载、切分、索引、召回和生成的边界拆清楚。

知道 RAG 不是把文档塞进模型,而是信息检索和生成的组合。

能画出一个最小 RAG 流程图,并标注每一步的输入输出。

Document loaderChunkingVector indexRetriever

改进召回质量

比较向量检索、关键词检索、混合检索和重排的使用边界。

能根据文档形态和问题类型选择检索策略。

能解释为什么某个问题没有召回正确上下文。

Embedding 选择Hybrid searchRerankerMetadata filter

建立评测样本

用真实问题、期望答案和引用片段判断系统是否变好。

避免只凭单次演示判断 RAG 质量。

能维护一组回归问题,并比较两版检索策略的差异。

Golden datasetFaithfulnessContext precision人工抽检
工程化5-6 周

Agent 与生产工程

学习工具调用、多步骤任务、评测观测、成本控制和部署边界。

适合谁
已经在做 AI 应用,希望让系统能可靠处理多步骤任务的工程化读者。
学完能做什么
能判断什么时候需要 Agent,并为 Agent 工作流设计权限、日志、评测和回退方案。

从工具调用开始

不要一上来追求自主 Agent,先把模型调用外部工具的接口做稳。

理解工具 schema、权限和执行结果如何影响模型行为。

能实现一个带工具调用的受控任务流程。

Tool schemaFunction calling权限边界失败重试

设计多步骤工作流

把规划、执行、观察、修正拆成可记录的状态流。

让复杂任务可以复盘,而不是只看到最终回答。

能描述一个 Agent trace,并指出每步失败点。

PlanningState machineMemoryHuman-in-the-loop

进入生产闭环

用评测、观测、成本和安全策略约束 Agent 的真实运行。

把 Agent 从 demo 变成可监控、可回滚、可改进的系统。

能列出上线前必须检查的评测集、日志、权限和成本指标。

EvalsTracingCost budget安全与审计

Audience

按你的角色选择路径

不同读者需要的深度不同。先选对优先级,比把所有材料从头刷一遍更重要。

产品 / 运营 / 非工程读者

重点理解能力边界、场景判断和工作流改造,不需要先陷入框架细节。

优先学
先学模型能力、Prompt、RAG 适用场景和评测指标。
先跳过
暂时跳过推理部署、向量数据库调优和 Agent 框架源码。
第一步
从 AI 基础路线开始,读完每阶段的 deliverable 再进入资源页。
进入相关内容

应用开发者

重点把模型接入真实产品:API、结构化输出、RAG、工具调用和错误处理。

优先学
优先学习 Prompt/API、RAG 链路、工具调用、日志和回归评测。
先跳过
不要一开始就追求全自动 Agent 或复杂模型微调。
第一步
按基础路线做一个小工具,再进入 RAG 路线。
进入相关内容

工程化进阶

重点关注系统可靠性:观测、评测、成本、安全、部署和多模型治理。

优先学
优先学习 evals、tracing、模型网关、权限边界和自托管成本。
先跳过
可以跳过基础概念卡片,但不要跳过评测和回滚设计。
第一步
从 Agent 与生产工程路线开始,同时看开源项目目录。
进入相关内容

Topics

核心主题矩阵

这些主题构成从“会用模型”到“能做系统”的骨架。每个主题都能继续拆成知识条目、资源和开源项目。

模型与推理

理解模型如何接收上下文、生成输出,以及能力边界为什么会变化。

预训练 / 微调上下文窗口推理参数多模态输入

Prompt 与结构化输出

把自然语言请求变成可复用、可测试、可接入系统的调用方式。

任务说明示例约束JSON schema失败重试

Embedding 与检索

学习如何把文本转成可比较的表示,并用检索找回相关上下文。

向量表示相似度Hybrid searchRerank

RAG 应用架构

把私有资料、业务文档和模型生成连接起来,形成可调试的知识应用。

切分索引引用答案忠实度

Agent 与工具调用

让模型调用外部工具和执行多步骤任务,同时保持权限和状态可控。

Tool schemaPlanningMemoryHuman-in-the-loop

评测、观测与成本

用数据判断系统是否变好,并持续控制质量、延迟、费用和风险。

Golden setTracingLatencyCost budget