note

✅ 词汇解释：

一、基础层

Artificial Intelligence (AI)
- 人工智能，使机器模拟人类智能，应用于推荐系统、图像识别等。
Machine Learning (ML)
- 机器学习，系统通过无显式编程从数据中自动学习模式。
Deep Learning (DL)
- 深度学习，通过多层神经网络逐步提取特征。
Supervised Learning
- 监督学习，使用标注过的数据训练已知输入与输出映射。
Unsupervised Learning
- 无监督学习，发现数据中的隐藏结构，如聚类。
Reinforcement Learning (RL)
- 强化学习，系统通过与环境交互获取奖励信号，改进决策。
Transfer Learning
- 迁移学习，将已有任务的知识迁移至新的相关任务。
Few-shot Learning
- 小样本学习，用极少量标注样本完成新类别识别。
Zero-shot Learning
- 零样本学习，通过语义描述泛化识别从未见过的类别。

二、大模型层

Large Language Model (LLM)
- 大语言模型，具备强大语言理解和生成能力。
Transformer
- 神经网络架构，通过自注意力机制处理序列数据，是LLM 的基石。
Self-Attention
- 让模型在序列处理时理解每个词语与其他词语的依赖关系。
Positional Encoding
- 为序列添加位置信息，使得模型理解词序。
Pre-training
- 模型在大规模无标注数据上学习通用语言表示的阶段。
Fine-tuning
- 在预训练模型基础上使用特定领域数据进行再训练。
RLHF (Reward Learning from Human Feedback)
- 通过人类反馈进行强化学习，优化语言模型。
Alignment
- 确保AI行为符合人类价值观与预期。
Prompt Engineering
- 设计输入指导模型生成预期内容。
Prompt Injection
- 恶意注入指令以绕过AI的安全限制。
Context Window
- AI模型单次处理的最大token数量，限制对话信息量。
Token
- 文本的最小语义单元，AI以token为单位进行处理。
Temperature
- 控制AI输出随机性的参数，影响生成内容的多样性。
Top-k Sampling
- 在概率最高的k个token中随机选择，影响生成结果的保守程度。
Beam Search
- 通过维护多个候选序列提升生成质量。
Chain-of-Thought (CoT)
- 让AI进行逐步推理，提高数学、代码等任务的准确性。

三、Agent 与推理层

AI Agent
- 能自主完成目标的系统，如订票、下单等。
MCP (Model Context Protocol)
- 标准化调用外部工具的接口，便于多个插件整合。
Tool Use / Function Calling
- AI调用外部工具或API完成具体任务，如搜索、编写代码。
ReAct 风格
- 思考后行动，形成完整的任务执行流程。
Planning
- 将复杂任务拆解为可执行的子任务。
Memory
- 存储和调用信息，使AI具有上下文感知能力。
Reflection
- AI对自己的行为进行反思以优化决策。
Tree of Thoughts
- 在每个推理节点探索多种路径，增强应对复杂问题的能力。
Reasoning Model
- 专门训练以完成多步推理任务，如数学、代码生成。
Agentic Workflow
- 多个Agent协作完成任务，模拟真实团队。
System 1 / System 2
- System 1 为快速响应，System 2 为深度推理，AI的不同处理模式。

四、RAG 与知识层

RAG (Retrieval-Augmented Generation)
- 通过检索外部知识库，增强生成内容的准确性。
Retrieval
- 从大规模文档中找到与查询最相关的片段。
Embedding
- 将文本等映射为低维向量，便于语义相似度计算。
Vector Database
- 存储和检索语义向量数据，是RAG的重要基础设施。
Semantic Search
- 基于语义而非关键字进行搜索。
Knowledge Graph
- 以图结构存储实体及其关系，便于推理。
Hallucination
- 生成内容虽看似合理但与事实不符。
Grounding
- 确保模型输出真实可靠，避免幻觉。

五、训练与优化层

Backpropagation
- 计算损失函数对参数的梯度，训练核心。
Loss Function
- 衡量预测结果与真实值之间差距的函数，评价模型表现。
Overfitting / Underfitting
- 过拟合：在训练效果好但泛化差；欠拟合：训练和新数据表现都不佳。
Regularization
- 通过惩罚项防止过拟合。
Batch Normalization
- 对数据进行标准化处理，提高训练速度与稳定性。
Dropout
- 随机丢弃部分神经元，防止过拟合。
Adam Optimizer
- 自适应学习率的优化器，提升训练效率。
Learning Rate
- 控制参数更新速度的超参数，过大过小都会影响效果。
Batch Size
- 影响训练速度与模型泛化。
Epoch
- 模型完整遍历所有训练数据的训练轮次。

六、NLP与CV层

Natural Language Processing (NLP)
- 处理、理解与生成人类语言，如客服、翻译、输入法。
Computer Vision (CV)
- 图像与视频的识别与处理，如人脸识别、自动驾驶、医学影像分析。
CNN (Convolutional Neural Network)
- 处理网格数据，具平移不变性。
RNN (Recurrent Neural Network)
- 处理序列数据，能记忆前文上下文。
LSTM / GRU
- RNN的改进版本，解决长期依赖、梯度消失问题。
Word Embedding
- 文本映射为向量空间，便于语义计算。
Attention Mechanism
- 在处理序列数据时自动关注重要内容。

七、扩散模型与生成层

Diffusion Model
- 通过逐步加噪和去噪生成图像。
Stable Diffusion / DALL-E / Midjourney
- 文生图模型，各有特色，如稳定性、艺术风格、生成能力。
Score-based Model
- 学习数据分布的梯度，生成符合要求的数据。
VAE (Variational Autoencoder)
- 编码-解码结构学习潜在表示，用于图像生成。
GAN (Generative Adversarial Network)
- 通过竞争提升生成质量。
Text-to-Image / Image-to-Image / Inpainting
- 文生图、图生图、图像修复三种生成方式。

八、多模态与前沿技术

Multimodal
- 能处理多种类型数据（如文本、图像、音频），接近人类感知方式。
Vision Transformer (ViT)
- 将Transformer结构应用于图像识别。
CLIP
- 训练图像与文本之间的映射，实现图像搜索和图像可控。
SAM (Segment Anything Model)
- 图像分割模型，分割任意物体。
GPT-4V / Large Multimodal Model
- 支持多模态输入的模型，提升任务灵活性。
Video Generation
- 基于文本或图像生成视频。

九、AI安全与伦理

AI Safety
- 研究AI行为是不是可控、可靠。
Explainability / Interpretability
- 使人类能理解AI决策过程，需区分模型层面和应用层面。
Bias / Fairness
- 训练数据或模型设计造成的偏差，需向公平性看齐。
Privacy
- 确保AI在训练与应用过程中保护用户隐私。
Adversarial Attack / Robustness
- 攻击方式与防御机制，保障AI免受干扰。
Alignment Problem / Value Alignment
- 使AI的行为与人类意图一致，是AI发展核心挑战。
AI Governance
- AI的法律监管框架，如欧盟AI Act。

十、部署与应用

Edge AI / On-device Inference
- 在本地设备上运行模型，隐私重要，但需优化模型体积。
Model Compression / Quantization / Pruning
- 通过各类压缩技术使模型适应边缘设备。
Knowledge Distillation
- 大模型训练小模型，缩小差距。
API / Inference / Latency / Throughput
- 提供AI能力接口，关注延迟与吞吐效率。

十一、数据相关

Training Data / Test Data / Validation Data
- 不同数据的用途。
Data Augmentation
- 对数据施加变换提升泛化能力。
Label / Annotation / Data Pipeline
- 标注、大数据处理流程，是AI训练的重要环节。
Crowdsourcing / Synthetic Data
- 多种数据获取方式。

十二、工程实践层

Harness Engineering / Context Engineering / Agent Skills
- 构建AI系统的关键环节，包括约束、工作效率、功能技能。
System Prompt / User Prompt
- AI行为与输出的关键影响因素，需精准设计。
Codex / GitHub Copilot
- AI编程工具，提升开发效率。

十三、社区术语与工具

OpenClaw / Hermes Agent / Manus / Codex / GPT-4V
- 各种开源或商业化AI助手或工具，涵盖AI编程、推理、图像处理。
AIGC (AI Generated Content)
- AI生成的内容，包括文本、图像、音乐等。
RAG Pipeline / Prompt Injection /Reflection / Feedback Loop / Constraint Design / Engineering Frameworks
- AI模型的优化与调整机制。

重点技术术语与通俗解释：

Prompt Engineering (提示工程)： 优化输入指令，使其生成高质量输出。
RLHF (Reinforcement Learning from Human Feedback)： 通过人类反馈改进语言模型质量。
RAG (Retrieval-Augmented Generation)： 检索增强生成，避免模型知识过时或错误。
Token（词元）： 文本被切分的最小语义单位，影响生成效果。
Vision Transformer (ViT)： 继承Transformer结构用于图像处理，提升模型能力。
Self-Attention： 增强模型对上下文的理解，提高文本处理质量。
Embedding： 文本/图像映射为向量后便于语义计算。
Adam Optimizer： 优化神经网络训练，更精准地调整参数。