概念 · 协议 · 方法论
AI 概念百科
MCP、RAG、Agent、Vibe Coding……AI 时代的核心概念通俗解释,程序员理解 AI 的知识库。
CATEGORIES/ 04
01 / 04协议
02 / 04概念
概念
AI Agent(智能体)
能自主感知环境、规划任务、调用工具、持续迭代的 AI 系统,从聊天机器人进化到能干活的数字员工。
Agent智能体工具调用
概念
Embedding(向量嵌入)
把文本、图片等数据转成高维向量,让机器能通过向量距离衡量语义相似度——RAG、搜索、推荐的基础。
Embedding向量语义搜索
概念
Function Calling(函数调用)
让大模型根据用户意图自动选择并调用外部函数/API 的能力。是 AI Agent 的基础能力,让模型从对话进化到行动。
Function Calling工具调用Agent
概念
Hallucination(幻觉)
大模型生成看似合理但事实上错误或虚构的内容。幻觉是 LLM 最大的可靠性挑战,无法完全消除,但可以通过多种方法缓解。
幻觉可靠性RAG
概念
Temperature 与 Top-P(采样参数)
控制 LLM 输出随机性的两个核心参数:Temperature 调节概率分布的平坦度,Top-P 限制候选词范围。
TemperatureTop-P采样
概念
Token(令牌)
大模型处理文本的最小单位。一个 Token 约等于 0.75 个英文单词或 1-2 个汉字。Token 数量决定 API 费用和上下文窗口占用。
Token基础概念定价
03 / 04方法论
方法论
Context Engineering(上下文工程)
通过精心设计 prompt 上下文(系统提示、示例、检索结果、工具定义)来最大化 LLM 表现的工程方法论。
Context EngineeringPrompt工程上下文窗口
方法论
Fine-tuning vs RAG
两种让大模型适应特定场景的方法对比:Fine-tuning 修改模型权重,RAG 引入外部知识。大多数场景应该用 RAG。
Fine-tuningRAG模型微调
方法论
LoRA(低秩适配)
Low-Rank Adaptation,一种高效微调方法:冻结原模型权重,只训练一个很小的低秩矩阵,大幅降低微调成本。
LoRA微调高效训练
方法论
Prompt Engineering(提示词工程)
通过精心设计提示词来引导 LLM 生成高质量输出的技术,包括 few-shot、CoT、角色设定、结构化输出等方法。
Prompt提示词CoT
方法论
Vibe Coding
用自然语言与 AI 对话式编程,开发者描述意图、AI 写代码,像指挥一个全栈工程师干活。
Vibe Coding编程方法论AI编程
04 / 04架构