AI Basecamp

Roadmap

四个阶段建立学习节奏

这四步不是课程章节，而是判断学习优先级的坐标。每一步都应该产出一个能被复盘的结果。

01

建立共同语言

先补齐模型、数据、Token、上下文、Embedding 和推理的基本概念。

模型与推理TokenEmbedding上下文窗口

能判断一个 AI 需求大概需要哪类能力。

进入此阶段

02

会用模型做事

从聊天走向 Prompt 结构、API 调用、结构化输出和错误处理。

PromptAPI结构化输出人工复核

能做一个可演示的模型调用小工具。

进入此阶段

03

连接知识与工具

学习 RAG、工具调用和轻量工作流，让模型接入真实上下文。

RAG检索工具调用工作流

能把私有资料或业务工具接进 AI 应用。

进入此阶段

04

进入生产闭环

补上评测、观测、成本、安全和部署，让应用可持续改进。

EvalsTracing成本控制权限审计

能为 AI 应用设计上线检查清单。

进入此阶段

Paths

三条主线按顺序推进

如果不知道先学哪条，就从第一条开始。已经在做项目的读者可以直接跳到 RAG 或 Agent 路线。

入门3-4 周

适合谁: 第一次系统学习 AI，或希望补齐概念框架的读者。
学完能做什么: 能判断模型能力边界，并完成一个可解释的小型 AI 应用。

建立共同语言

先理解模型、Token、上下文窗口和 Embedding，避免只会背工具名。

知道 LLM 输入输出的基本约束。

能用自己的话解释模型、Token、上下文窗口和 Embedding。

模型、参数与推理Token 与上下文窗口Embedding 与相似度训练、微调与调用的区别

看知识目录

会让模型稳定输出

从普通提问进入结构化提示、格式约束和 API 调用。

把模型当作可组合的软件能力使用。

能设计一个返回 JSON 的提示词，并解释失败时该查什么。

Prompt 结构结构化输出函数和工具调用基础安全边界

查资源导航

做一个小应用

把模型调用接入一个实际任务，而不是停留在聊天窗口。

完成从需求、输入、调用、输出到错误处理的小闭环。

能做出一个摘要、分类、问答或资料整理的可演示原型。

任务拆解输入清洗错误处理人工复核

读实践文章

进阶4-5 周

适合谁: 已经会调用模型，想把私有文档、业务知识或长文本接入 AI 应用的开发者。
学完能做什么: 能设计一个可调试、可评测的 RAG 原型，并知道什么时候不该用 RAG。

理解检索链路

先把加载、切分、索引、召回和生成的边界拆清楚。

知道 RAG 不是把文档塞进模型，而是信息检索和生成的组合。

能画出一个最小 RAG 流程图，并标注每一步的输入输出。

Document loaderChunkingVector indexRetriever

看 RAG 专题

改进召回质量

比较向量检索、关键词检索、混合检索和重排的使用边界。

能根据文档形态和问题类型选择检索策略。

能解释为什么某个问题没有召回正确上下文。

Embedding 选择Hybrid searchRerankerMetadata filter

看开源项目

建立评测样本

用真实问题、期望答案和引用片段判断系统是否变好。

避免只凭单次演示判断 RAG 质量。

能维护一组回归问题，并比较两版检索策略的差异。

Golden datasetFaithfulnessContext precision人工抽检

找评测资源

工程化5-6 周

适合谁: 已经在做 AI 应用，希望让系统能可靠处理多步骤任务的工程化读者。
学完能做什么: 能判断什么时候需要 Agent，并为 Agent 工作流设计权限、日志、评测和回退方案。

从工具调用开始

不要一上来追求自主 Agent，先把模型调用外部工具的接口做稳。

理解工具 schema、权限和执行结果如何影响模型行为。

能实现一个带工具调用的受控任务流程。

Tool schemaFunction calling权限边界失败重试

看工程文章

设计多步骤工作流

把规划、执行、观察、修正拆成可记录的状态流。

让复杂任务可以复盘，而不是只看到最终回答。

能描述一个 Agent trace，并指出每步失败点。

PlanningState machineMemoryHuman-in-the-loop

查 Agent 项目

进入生产闭环

用评测、观测、成本和安全策略约束 Agent 的真实运行。

把 Agent 从 demo 变成可监控、可回滚、可改进的系统。

能列出上线前必须检查的评测集、日志、权限和成本指标。

EvalsTracingCost budget安全与审计

看资源导航

Audience

按你的角色选择路径

不同读者需要的深度不同。先选对优先级，比把所有材料从头刷一遍更重要。

Topics

核心主题矩阵

这些主题构成从“会用模型”到“能做系统”的骨架。每个主题都能继续拆成知识条目、资源和开源项目。

模型与推理

理解模型如何接收上下文、生成输出，以及能力边界为什么会变化。

预训练 / 微调上下文窗口推理参数多模态输入

Prompt 与结构化输出

把自然语言请求变成可复用、可测试、可接入系统的调用方式。

任务说明示例约束JSON schema失败重试

Embedding 与检索

学习如何把文本转成可比较的表示，并用检索找回相关上下文。

向量表示相似度Hybrid searchRerank

RAG 应用架构

把私有资料、业务文档和模型生成连接起来，形成可调试的知识应用。

切分索引引用答案忠实度

Agent 与工具调用

让模型调用外部工具和执行多步骤任务，同时保持权限和状态可控。

Tool schemaPlanningMemoryHuman-in-the-loop

评测、观测与成本

用数据判断系统是否变好，并持续控制质量、延迟、费用和风险。

Golden setTracingLatencyCost budget

学习路线负责确定顺序，具体材料分散在站内其他栏目。按当前问题选择入口即可。

去知识目录

查概念、术语和基础解释。

去资源导航

找官方文档、课程、工具和论文入口。

去专题合集

围绕 RAG、AI 编程和应用架构持续深入。

去文章

跟踪近期模型发布、工程实践和行业动态。

去开源项目

比较 LLMOps、RAG、Agent、推理和本地模型工具。

从零到能落地 AI 应用的学习地图

四个阶段建立学习节奏

建立共同语言

会用模型做事

连接知识与工具

进入生产闭环

三条主线按顺序推进

AI 基础到应用入门

建立共同语言

会让模型稳定输出

做一个小应用

RAG 与知识库应用

理解检索链路

改进召回质量

建立评测样本

Agent 与生产工程

从工具调用开始

设计多步骤工作流

进入生产闭环

按你的角色选择路径

产品 / 运营 / 非工程读者

应用开发者

工程化进阶

核心主题矩阵

模型与推理

Prompt 与结构化输出

Embedding 与检索

RAG 应用架构

Agent 与工具调用

评测、观测与成本

下一步去哪

去知识目录

去资源导航

去专题合集

去文章

去开源项目