从可落地、可复用、可与现有技术栈结合的角度来看,现在学习 AI 不宜走“学院派全套”,而应采用工程导向 + 应用优先的路径。结合你目前从事 Web 软件开发 的背景,建议如下路线。
一、先统一一个认知:现在的「学 AI」学什么
对工程人员而言,当前主流并且商业价值最高的 AI 能力主要集中在三层:
模型使用层(最重要)
调用大模型 API(LLM / 多模态)
提示词工程(Prompt Engineering)
工具调用 / Function Calling
Agent / Workflow 编排
模型工程层(进阶)
向量数据库、RAG
微调(Fine-tuning / LoRA)
推理性能、上下文管理、成本控制
模型原理层(选学)
Transformer 基础
注意力机制
简单训练流程
👉 不建议一开始深挖
结论:
现在不是“学 AI 算法”,而是“学如何把 AI 变成生产力”。
二、推荐的学习路线(工程向,6 个阶段)
阶段 1:基础概念(1–3 天)
目标:避免“只会用,不知道在干什么”
你需要搞清楚这些关键词即可:
LLM / 多模态
Prompt / System Prompt
Token / Context Window
Embedding
RAG
Function Calling / Tool Calling
Agent vs Workflow
👉 不需要数学,不需要公式
阶段 2:直接上手调用大模型(关键)
必做内容:
使用 OpenAI / 通义 / Claude / DeepSeek 之一
用 Node.js / Python 写一个最简单的 API 调用
你需要掌握:
对话上下文如何维护
system / user / assistant 的角色区别
temperature、max_tokens 的作用
流式输出(stream)
目标能力:
能把 AI 当成一个“可控的服务组件”,而不是黑盒聊天机器人
阶段 3:Prompt 工程(比算法重要)
这是目前性价比最高的能力。
重点学:
结构化 Prompt(角色、目标、约束、示例)
Chain of Thought(思路引导)
Few-shot
输出格式控制(JSON / Schema)
你要做到:
同一个模型,通过 Prompt 让效果差距 10 倍
阶段 4:RAG(AI 工程分水岭)
这是区分「会用 AI」和「能做 AI 产品」的关键。
你需要掌握:
文本切分策略(chunk)
向量化(Embedding)
向量数据库(Milvus / Qdrant / FAISS)
检索 + 重排
Prompt 中如何注入上下文
实践建议:
做一个「企业知识库 / 外贸资料库 / 技术文档问答」
阶段 5:Agent / Workflow(进阶)
学习:
Function Calling
多步骤推理
工具调用(搜索、数据库、接口)
状态管理
目标:
AI 能“自己拆任务 + 调接口 + 给结果”
这一步开始,AI 才真正像一个“数字员工”。
阶段 6:部署与成本控制(工程化)
你需要关心:
Token 成本
缓存策略
并发控制
降级方案
私有化部署(vLLM / Ollama)
这是商业系统必备能力。
三、技术栈建议(贴合 Web 开发)
后端
Node.js / Python(二选一即可)
FastAPI / Express
AI 框架
LangChain(理解思想即可)
LlamaIndex
或自行封装(更可控)
向量库
Qdrant / Milvus
轻量可先 FAISS
模型选择策略
公有云 API → 快速验证
私有模型 → 成本 / 合规 / 可控性
四、不建议一开始做的事情(踩坑预警)
❌ 上来学深度学习公式
❌ 从零手写 Transformer
❌ 一开始就训练模型
❌ 纠结哪个模型“最强”
先做产品,再补原理。
五、一个非常现实的学习目标(建议)
30 天内目标:
做一个「带知识库的 AI 应用」,
能回答你所在行业的专业问题,
并能部署上线、可控成本。