Skip to content

词汇解释:

一、基础层
  1. Artificial Intelligence (AI)

    • 人工智能,使机器模拟人类智能,应用于推荐系统、图像识别等。
  2. Machine Learning (ML)

    • 机器学习,系统通过无显式编程从数据中自动学习模式。
  3. Deep Learning (DL)

    • 深度学习,通过多层神经网络逐步提取特征。
  4. Supervised Learning

    • 监督学习,使用标注过的数据训练已知输入与输出映射。
  5. Unsupervised Learning

    • 无监督学习,发现数据中的隐藏结构,如聚类。
  6. Reinforcement Learning (RL)

    • 强化学习,系统通过与环境交互获取奖励信号,改进决策。
  7. Transfer Learning

    • 迁移学习,将已有任务的知识迁移至新的相关任务。
  8. Few-shot Learning

    • 小样本学习,用极少量标注样本完成新类别识别。
  9. Zero-shot Learning

    • 零样本学习,通过语义描述泛化识别从未见过的类别。
二、大模型层
  1. Large Language Model (LLM)

    • 大语言模型,具备强大语言理解和生成能力。
  2. Transformer

    • 神经网络架构,通过自注意力机制处理序列数据,是LLM 的基石。
  3. Self-Attention

    • 让模型在序列处理时理解每个词语与其他词语的依赖关系。
  4. Positional Encoding

    • 为序列添加位置信息,使得模型理解词序。
  5. Pre-training

    • 模型在大规模无标注数据上学习通用语言表示的阶段。
  6. Fine-tuning

    • 在预训练模型基础上使用特定领域数据进行再训练。
  7. RLHF (Reward Learning from Human Feedback)

    • 通过人类反馈进行强化学习,优化语言模型。
  8. Alignment

    • 确保AI行为符合人类价值观与预期。
  9. Prompt Engineering

    • 设计输入指导模型生成预期内容。
  10. Prompt Injection

    • 恶意注入指令以绕过AI的安全限制。
  11. Context Window

    • AI模型单次处理的最大token数量,限制对话信息量。
  12. Token

    • 文本的最小语义单元,AI以token为单位进行处理。
  13. Temperature

    • 控制AI输出随机性的参数,影响生成内容的多样性。
  14. Top-k Sampling

    • 在概率最高的k个token中随机选择,影响生成结果的保守程度。
  15. Beam Search

    • 通过维护多个候选序列提升生成质量。
  16. Chain-of-Thought (CoT)

    • 让AI进行逐步推理,提高数学、代码等任务的准确性。
三、Agent 与推理层
  1. AI Agent

    • 能自主完成目标的系统,如订票、下单等。
  2. MCP (Model Context Protocol)

    • 标准化调用外部工具的接口,便于多个插件整合。
  3. Tool Use / Function Calling

    • AI调用外部工具或API完成具体任务,如搜索、编写代码。
  4. ReAct 风格

    • 思考后行动,形成完整的任务执行流程。
  5. Planning

    • 将复杂任务拆解为可执行的子任务。
  6. Memory

    • 存储和调用信息,使AI具有上下文感知能力。
  7. Reflection

    • AI对自己的行为进行反思以优化决策。
  8. Tree of Thoughts

    • 在每个推理节点探索多种路径,增强应对复杂问题的能力。
  9. Reasoning Model

    • 专门训练以完成多步推理任务,如数学、代码生成。
  10. Agentic Workflow

    • 多个Agent协作完成任务,模拟真实团队。
  11. System 1 / System 2

    • System 1 为快速响应,System 2 为深度推理,AI的不同处理模式。
四、RAG 与知识层
  1. RAG (Retrieval-Augmented Generation)

    • 通过检索外部知识库,增强生成内容的准确性。
  2. Retrieval

    • 从大规模文档中找到与查询最相关的片段。
  3. Embedding

    • 将文本等映射为低维向量,便于语义相似度计算。
  4. Vector Database

    • 存储和检索语义向量数据,是RAG的重要基础设施。
  5. Semantic Search

    • 基于语义而非关键字进行搜索。
  6. Knowledge Graph

    • 以图结构存储实体及其关系,便于推理。
  7. Hallucination

    • 生成内容虽看似合理但与事实不符。
  8. Grounding

    • 确保模型输出真实可靠,避免幻觉。
五、训练与优化层
  1. Backpropagation

    • 计算损失函数对参数的梯度,训练核心。
  2. Loss Function

    • 衡量预测结果与真实值之间差距的函数,评价模型表现。
  3. Overfitting / Underfitting

    • 过拟合:在训练效果好但泛化差;欠拟合:训练和新数据表现都不佳。
  4. Regularization

    • 通过惩罚项防止过拟合。
  5. Batch Normalization

    • 对数据进行标准化处理,提高训练速度与稳定性。
  6. Dropout

    • 随机丢弃部分神经元,防止过拟合。
  7. Adam Optimizer

    • 自适应学习率的优化器,提升训练效率。
  8. Learning Rate

    • 控制参数更新速度的超参数,过大过小都会影响效果。
  9. Batch Size

    • 影响训练速度与模型泛化。
  10. Epoch

    • 模型完整遍历所有训练数据的训练轮次。
六、NLP与CV层
  1. Natural Language Processing (NLP)

    • 处理、理解与生成人类语言,如客服、翻译、输入法。
  2. Computer Vision (CV)

    • 图像与视频的识别与处理,如人脸识别、自动驾驶、医学影像分析。
  3. CNN (Convolutional Neural Network)

    • 处理网格数据,具平移不变性。
  4. RNN (Recurrent Neural Network)

    • 处理序列数据,能记忆前文上下文。
  5. LSTM / GRU

    • RNN的改进版本,解决长期依赖、梯度消失问题。
  6. Word Embedding

    • 文本映射为向量空间,便于语义计算。
  7. Attention Mechanism

    • 在处理序列数据时自动关注重要内容。
七、扩散模型与生成层
  1. Diffusion Model

    • 通过逐步加噪和去噪生成图像。
  2. Stable Diffusion / DALL-E / Midjourney

    • 文生图模型,各有特色,如稳定性、艺术风格、生成能力。
  3. Score-based Model

    • 学习数据分布的梯度,生成符合要求的数据。
  4. VAE (Variational Autoencoder)

    • 编码-解码结构学习潜在表示,用于图像生成。
  5. GAN (Generative Adversarial Network)

    • 通过竞争提升生成质量。
  6. Text-to-Image / Image-to-Image / Inpainting

    • 文生图、图生图、图像修复三种生成方式。
八、多模态与前沿技术
  1. Multimodal

    • 能处理多种类型数据(如文本、图像、音频),接近人类感知方式。
  2. Vision Transformer (ViT)

    • 将Transformer结构应用于图像识别。
  3. CLIP

    • 训练图像与文本之间的映射,实现图像搜索和图像可控。
  4. SAM (Segment Anything Model)

    • 图像分割模型,分割任意物体。
  5. GPT-4V / Large Multimodal Model

    • 支持多模态输入的模型,提升任务灵活性。
  6. Video Generation

    • 基于文本或图像生成视频。
九、AI安全与伦理
  1. AI Safety

    • 研究AI行为是不是可控、可靠。
  2. Explainability / Interpretability

    • 使人类能理解AI决策过程,需区分模型层面和应用层面。
  3. Bias / Fairness

    • 训练数据或模型设计造成的偏差,需向公平性看齐。
  4. Privacy

    • 确保AI在训练与应用过程中保护用户隐私。
  5. Adversarial Attack / Robustness

    • 攻击方式与防御机制,保障AI免受干扰。
  6. Alignment Problem / Value Alignment

    • 使AI的行为与人类意图一致,是AI发展核心挑战。
  7. AI Governance

    • AI的法律监管框架,如欧盟AI Act。
十、部署与应用
  1. Edge AI / On-device Inference

    • 在本地设备上运行模型,隐私重要,但需优化模型体积。
  2. Model Compression / Quantization / Pruning

    • 通过各类压缩技术使模型适应边缘设备。
  3. Knowledge Distillation

    • 大模型训练小模型,缩小差距。
  4. API / Inference / Latency / Throughput

    • 提供AI能力接口,关注延迟与吞吐效率。
十一、数据相关
  1. Training Data / Test Data / Validation Data

    • 不同数据的用途。
  2. Data Augmentation

    • 对数据施加变换提升泛化能力。
  3. Label / Annotation / Data Pipeline

    • 标注、大数据处理流程,是AI训练的重要环节。
  4. Crowdsourcing / Synthetic Data

    • 多种数据获取方式。
十二、工程实践层
  1. Harness Engineering / Context Engineering / Agent Skills

    • 构建AI系统的关键环节,包括约束、工作效率、功能技能。
  2. System Prompt / User Prompt

    • AI行为与输出的关键影响因素,需精准设计。
  3. Codex / GitHub Copilot

    • AI编程工具,提升开发效率。
十三、社区术语与工具
  1. OpenClaw / Hermes Agent / Manus / Codex / GPT-4V

    • 各种开源或商业化AI助手或工具,涵盖AI编程、推理、图像处理。
  2. AIGC (AI Generated Content)

    • AI生成的内容,包括文本、图像、音乐等。
  3. RAG Pipeline / Prompt Injection /Reflection / Feedback Loop / Constraint Design / Engineering Frameworks

    • AI模型的优化与调整机制。

重点技术术语与通俗解释:

  • Prompt Engineering (提示工程): 优化输入指令,使其生成高质量输出。
  • RLHF (Reinforcement Learning from Human Feedback): 通过人类反馈改进语言模型质量。
  • RAG (Retrieval-Augmented Generation): 检索增强生成,避免模型知识过时或错误。
  • Token(词元): 文本被切分的最小语义单位,影响生成效果。
  • Vision Transformer (ViT): 继承Transformer结构用于图像处理,提升模型能力。
  • Self-Attention: 增强模型对上下文的理解,提高文本处理质量。
  • Embedding: 文本/图像映射为向量后便于语义计算。
  • Adam Optimizer: 优化神经网络训练,更精准地调整参数。

更新于:

note