note

定义：数据结构是数据元素的集合，包含逻辑结构、物理结构和数据运算三要素。
核心思想：数据结构的学习应紧扣“逻辑结构决定可执行的操作，物理存储决定操作的成本”这一根本原则。
逻辑结构分类：
- 集合结构：元素之间无直接关系。
- 线性结构：元素之间存在一对一关系。
- 树形结构：元素之间存在一对多关系。
- 图形结构：元素之间存在多对多关系。
物理存储分类：
- 顺序存储：连续内存，如数组。
- 链式存储：离散节点，通过指针链接。
- 散列存储：通过哈希函数映射存储地址。
- 索引存储：附加索引表，如 B+ 树。
数据结构选型方法论：从逻辑结构出发，结合物理存储特性，分析时间与空间复杂度，最终匹配适用场景。
工程实现案例：以 Java 集合框架（如 ArrayList、LinkedList、HashMap、TreeMap、PriorityQueue、ConcurrentSkipListMap）为例，说明不同结构的实现方式。

六大篇章：
- 基础概念篇：建立逻辑与物理结构分离思想，掌握复杂度分析方法。
- 线性结构篇：深入顺序表与链表，分析其操作特性与适用场景。
- 树形结构篇：从通用树到二叉搜索树、平衡树、堆。
- 散列结构篇：聚焦散列表，分析冲突解决与性能影响。
- 高级结构篇：解析跳表与图的结构特性。
- 选型与面试篇：通过决策树与面试专题，形成工程选型与面试准备方法论。
核心推演逻辑：逻辑结构分类 → 物理实现选择 → 操作复杂度分析 → 特性与场景匹配。
关键结论：逻辑结构决定操作，物理结构决定成本，选型需结合两者。

逻辑结构四分类：
- 集合、线性、树形、图形。
物理结构四分类：
- 顺序、链式、散列、索引。
逻辑与物理映射：
- 同一逻辑结构可采用不同物理实现，导致性能差异。
典型映射示例：
- 集合结构 + 散列存储 → HashSet。
- 线性结构 + 顺序存储 → ArrayList。
- 线性结构 + 链式存储 → LinkedList。
- 树形结构 + 顺序存储 → 堆。
- 图形结构 + 链式+顺序组合 → 邻接表。
关键结论：逻辑结构与物理结构的分离是现代数据结构设计的核心思想。

树与二叉树：
- 定义：树是有限集合，二叉树每个节点最多两个子节点。
- 核心术语：根、父、子、深度、高度、层。
- 遍历方式：前序、中序、后序、层序。
二叉搜索树 (BST)：
- 性质：左子树 < 根 < 右子树。
- 操作复杂度：理想 O(log n)，退化为链表时 O(n)。
平衡二叉树 (AVL)：
- 性质：高度差 ≤1。
- 操作复杂度：查找 O(log n)，插入/删除需旋转，复杂度较高。
红黑树：
- 性质：弱平衡，黑高一致。
- 操作复杂度：查找、插入、删除均为 O(log n)。
- 适用场景：读写混合、通用有序映射。
二叉堆：
- 性质：完全二叉树，父节点与子节点满足偏序关系。
- 操作复杂度：
  - 插入：O(log n)。
  - 删除堆顶：O(log n)。
  - 建堆：O(n)。
- 适用场景：优先级调度、Top K 问题、堆排序、图算法。
关键结论：红黑树在综合性能上优于 AVL，适合通用场景；堆适合优先级操作，不支持范围查找。

散列表：
- 核心思想：通过哈希函数实现平均 O(1) 查找。
- 冲突解决策略：
  - 开链法（链表或红黑树）。
  - 开放寻址法（线性探测、二次探测、双重哈希）。
- 负载因子：α = n / capacity，影响性能。
- 适用场景：快速查找、去重、计数器、不关心顺序的单点访问。
Java 实现：HashMap 使用开链法，链表过长时树化。
关键结论：散列表是“空间换时间”的典范，但需警惕性能退化。

跳表：
- 定义：随机化多层有序链表，支持 O(log n) 查找。
- 核心操作：查找、插入、删除。
- 适用场景：高并发、有序键值对、范围查询。
- Java 实现：ConcurrentSkipListMap。
图：
- 定义：图 G = (V, E)，顶点与边构成。
- 存储方式：
  - 邻接矩阵：O(V²) 空间，边查询 O(1)。
  - 邻接表：O(V+E) 空间，邻边遍历 O(1)。
- 适用场景：稠密图用邻接矩阵，稀疏图用邻接表。
关键结论：跳表适合并发场景，实现简单；图的存储方式需根据密度和查询频率选择。

数据结构选型决策树：
- 是否需要顺序：决定是否使用散列结构或有序结构。
- 操作模式：随机访问、增删、范围查找、最值需求。
- 并发需求：选择跳表或红黑树。
- 图特征：选择邻接矩阵或邻接表。
面试高频专题：
- 数据结构定义与分类：逻辑结构与物理结构的区别。
- 数组与链表：时间与空间复杂度差异。
- 栈与队列：LIFO 与 FIFO 的区别及实现。
- 二叉树与二叉搜索树：有序性与平衡性。
- 红黑树：五条性质、旋转次数、适用场景。
- 堆：完全二叉树、偏序关系、建堆优化。
- 散列表：冲突解决、负载因子、适用场景。
- 跳表：随机化、并发支持、范围查询。
- 图：邻接矩阵与邻接表的优劣。
关键结论：选型需结合业务负载特征与数据结构的物理特性，理论分析提供方向，实测验证最终选择。

本文系统梳理了数据结构的核心概念、分类、实现方式及适用场景，强调逻辑结构与物理存储的分离是选型的核心依据。通过 Java 集合框架等案例，展示了不同结构在实际工程中的应用。同时，针对面试高频问题，提供了详细的原理、特性与场景分析，帮助读者形成工程选型与面试准备的方法论。