✅ 词汇解释:
一、基础层
Artificial Intelligence (AI)
- 人工智能,使机器模拟人类智能,应用于推荐系统、图像识别等。
Machine Learning (ML)
- 机器学习,系统通过无显式编程从数据中自动学习模式。
Deep Learning (DL)
- 深度学习,通过多层神经网络逐步提取特征。
Supervised Learning
- 监督学习,使用标注过的数据训练已知输入与输出映射。
Unsupervised Learning
- 无监督学习,发现数据中的隐藏结构,如聚类。
Reinforcement Learning (RL)
- 强化学习,系统通过与环境交互获取奖励信号,改进决策。
Transfer Learning
- 迁移学习,将已有任务的知识迁移至新的相关任务。
Few-shot Learning
- 小样本学习,用极少量标注样本完成新类别识别。
Zero-shot Learning
- 零样本学习,通过语义描述泛化识别从未见过的类别。
二、大模型层
Large Language Model (LLM)
- 大语言模型,具备强大语言理解和生成能力。
Transformer
- 神经网络架构,通过自注意力机制处理序列数据,是LLM 的基石。
Self-Attention
- 让模型在序列处理时理解每个词语与其他词语的依赖关系。
Positional Encoding
- 为序列添加位置信息,使得模型理解词序。
Pre-training
- 模型在大规模无标注数据上学习通用语言表示的阶段。
Fine-tuning
- 在预训练模型基础上使用特定领域数据进行再训练。
RLHF (Reward Learning from Human Feedback)
- 通过人类反馈进行强化学习,优化语言模型。
Alignment
- 确保AI行为符合人类价值观与预期。
Prompt Engineering
- 设计输入指导模型生成预期内容。
Prompt Injection
- 恶意注入指令以绕过AI的安全限制。
Context Window
- AI模型单次处理的最大token数量,限制对话信息量。
Token
- 文本的最小语义单元,AI以token为单位进行处理。
Temperature
- 控制AI输出随机性的参数,影响生成内容的多样性。
Top-k Sampling
- 在概率最高的k个token中随机选择,影响生成结果的保守程度。
Beam Search
- 通过维护多个候选序列提升生成质量。
Chain-of-Thought (CoT)
- 让AI进行逐步推理,提高数学、代码等任务的准确性。
三、Agent 与推理层
AI Agent
- 能自主完成目标的系统,如订票、下单等。
MCP (Model Context Protocol)
- 标准化调用外部工具的接口,便于多个插件整合。
Tool Use / Function Calling
- AI调用外部工具或API完成具体任务,如搜索、编写代码。
ReAct 风格
- 思考后行动,形成完整的任务执行流程。
Planning
- 将复杂任务拆解为可执行的子任务。
Memory
- 存储和调用信息,使AI具有上下文感知能力。
Reflection
- AI对自己的行为进行反思以优化决策。
Tree of Thoughts
- 在每个推理节点探索多种路径,增强应对复杂问题的能力。
Reasoning Model
- 专门训练以完成多步推理任务,如数学、代码生成。
Agentic Workflow
- 多个Agent协作完成任务,模拟真实团队。
System 1 / System 2
- System 1 为快速响应,System 2 为深度推理,AI的不同处理模式。
四、RAG 与知识层
RAG (Retrieval-Augmented Generation)
- 通过检索外部知识库,增强生成内容的准确性。
Retrieval
- 从大规模文档中找到与查询最相关的片段。
Embedding
- 将文本等映射为低维向量,便于语义相似度计算。
Vector Database
- 存储和检索语义向量数据,是RAG的重要基础设施。
Semantic Search
- 基于语义而非关键字进行搜索。
Knowledge Graph
- 以图结构存储实体及其关系,便于推理。
Hallucination
- 生成内容虽看似合理但与事实不符。
Grounding
- 确保模型输出真实可靠,避免幻觉。
五、训练与优化层
Backpropagation
- 计算损失函数对参数的梯度,训练核心。
Loss Function
- 衡量预测结果与真实值之间差距的函数,评价模型表现。
Overfitting / Underfitting
- 过拟合:在训练效果好但泛化差;欠拟合:训练和新数据表现都不佳。
Regularization
- 通过惩罚项防止过拟合。
Batch Normalization
- 对数据进行标准化处理,提高训练速度与稳定性。
Dropout
- 随机丢弃部分神经元,防止过拟合。
Adam Optimizer
- 自适应学习率的优化器,提升训练效率。
Learning Rate
- 控制参数更新速度的超参数,过大过小都会影响效果。
Batch Size
- 影响训练速度与模型泛化。
Epoch
- 模型完整遍历所有训练数据的训练轮次。
六、NLP与CV层
Natural Language Processing (NLP)
- 处理、理解与生成人类语言,如客服、翻译、输入法。
Computer Vision (CV)
- 图像与视频的识别与处理,如人脸识别、自动驾驶、医学影像分析。
CNN (Convolutional Neural Network)
- 处理网格数据,具平移不变性。
RNN (Recurrent Neural Network)
- 处理序列数据,能记忆前文上下文。
LSTM / GRU
- RNN的改进版本,解决长期依赖、梯度消失问题。
Word Embedding
- 文本映射为向量空间,便于语义计算。
Attention Mechanism
- 在处理序列数据时自动关注重要内容。
七、扩散模型与生成层
Diffusion Model
- 通过逐步加噪和去噪生成图像。
Stable Diffusion / DALL-E / Midjourney
- 文生图模型,各有特色,如稳定性、艺术风格、生成能力。
Score-based Model
- 学习数据分布的梯度,生成符合要求的数据。
VAE (Variational Autoencoder)
- 编码-解码结构学习潜在表示,用于图像生成。
GAN (Generative Adversarial Network)
- 通过竞争提升生成质量。
Text-to-Image / Image-to-Image / Inpainting
- 文生图、图生图、图像修复三种生成方式。
八、多模态与前沿技术
Multimodal
- 能处理多种类型数据(如文本、图像、音频),接近人类感知方式。
Vision Transformer (ViT)
- 将Transformer结构应用于图像识别。
CLIP
- 训练图像与文本之间的映射,实现图像搜索和图像可控。
SAM (Segment Anything Model)
- 图像分割模型,分割任意物体。
GPT-4V / Large Multimodal Model
- 支持多模态输入的模型,提升任务灵活性。
Video Generation
- 基于文本或图像生成视频。
九、AI安全与伦理
AI Safety
- 研究AI行为是不是可控、可靠。
Explainability / Interpretability
- 使人类能理解AI决策过程,需区分模型层面和应用层面。
Bias / Fairness
- 训练数据或模型设计造成的偏差,需向公平性看齐。
Privacy
- 确保AI在训练与应用过程中保护用户隐私。
Adversarial Attack / Robustness
- 攻击方式与防御机制,保障AI免受干扰。
Alignment Problem / Value Alignment
- 使AI的行为与人类意图一致,是AI发展核心挑战。
AI Governance
- AI的法律监管框架,如欧盟AI Act。
十、部署与应用
Edge AI / On-device Inference
- 在本地设备上运行模型,隐私重要,但需优化模型体积。
Model Compression / Quantization / Pruning
- 通过各类压缩技术使模型适应边缘设备。
Knowledge Distillation
- 大模型训练小模型,缩小差距。
API / Inference / Latency / Throughput
- 提供AI能力接口,关注延迟与吞吐效率。
十一、数据相关
Training Data / Test Data / Validation Data
- 不同数据的用途。
Data Augmentation
- 对数据施加变换提升泛化能力。
Label / Annotation / Data Pipeline
- 标注、大数据处理流程,是AI训练的重要环节。
Crowdsourcing / Synthetic Data
- 多种数据获取方式。
十二、工程实践层
Harness Engineering / Context Engineering / Agent Skills
- 构建AI系统的关键环节,包括约束、工作效率、功能技能。
System Prompt / User Prompt
- AI行为与输出的关键影响因素,需精准设计。
Codex / GitHub Copilot
- AI编程工具,提升开发效率。
十三、社区术语与工具
OpenClaw / Hermes Agent / Manus / Codex / GPT-4V
- 各种开源或商业化AI助手或工具,涵盖AI编程、推理、图像处理。
AIGC (AI Generated Content)
- AI生成的内容,包括文本、图像、音乐等。
RAG Pipeline / Prompt Injection /Reflection / Feedback Loop / Constraint Design / Engineering Frameworks
- AI模型的优化与调整机制。
重点技术术语与通俗解释:
- Prompt Engineering (提示工程): 优化输入指令,使其生成高质量输出。
- RLHF (Reinforcement Learning from Human Feedback): 通过人类反馈改进语言模型质量。
- RAG (Retrieval-Augmented Generation): 检索增强生成,避免模型知识过时或错误。
- Token(词元): 文本被切分的最小语义单位,影响生成效果。
- Vision Transformer (ViT): 继承Transformer结构用于图像处理,提升模型能力。
- Self-Attention: 增强模型对上下文的理解,提高文本处理质量。
- Embedding: 文本/图像映射为向量后便于语义计算。
- Adam Optimizer: 优化神经网络训练,更精准地调整参数。
