跳至主要內容

01. 树形 DP 知识

ITCharge大约 17 分钟

树形 DP 知识

1. 树形动态规划简介

树形动态规划:简称为「树形 DP」,是一种在树形结构上进行推导的动态规划方法。如下图所示,树形 DP 的求解过程一般以节点从深到浅(子树从小到大)的顺序作为动态规划的「阶段」。在树形 DP 中,第 11 维通常是节点编号,代表以该节点为根的子树。

树形 DP 问题的划分方法有多种方式。

如果按照「阶段转移的方向」进行划分,可以划分为以下两种:

  1. 自底向上:通过递归的方式求解每棵子树,然后在回溯时,自底向上地从子节点向上进行状态转移。只有在当前节点的所有子树求解完毕之后,才可以求解当前节点,以及继续向上进行求解。
  2. 自顶向下:从根节点开始向下递归,逐层计算子节点的状态。这种方法常常使用记忆化搜索来避免重复计算,提高效率。

自顶向下的树形 DP 问题比较少见,大部分树形 DP 都是采用「自底向上」的方向进行推导。

如果按照「是否有固定根」进行划分,可以划分为以下两种:

  1. 固定根的树形 DP:事先指定根节点的树形 DP 问题,通常只需要从给定的根节点开始,使用 11 次深度优先搜索。
  2. 不定根的树形 DP:事先没有指定根节点的树形 DP 问题,并且根节点的变化会对一些值,例如子节点深度和、点权和等产生影响。通常需要使用 22 次深度优先搜索,第 11 次预处理诸如深度,点权和之类的信息,第 22 次开始运行换根动态规划。

本文中,我们将按照「是否有固定根」进行分类,对树形 DP 问题中这两种类型问题进行一一讲解。

2. 固定根的树形 DP

2.1 固定根的树形 DP 基本思路

固定根的树形 DP 问题,如果是二叉树,树通常是以根节点的形式给出。我们可以直接从指定根节点出发进行深度优先搜索。如果是多叉树,树是以一张 nn 个节点、n1n - 1 条边的无向图形式给出的,并且事先给出指定根节点的编号。这种情况下,我们要先用邻接表存储下这 nn 个点和 n1n - 1 条边,然后从指定根节点出发进行深度优先搜索,并注意标记节点是否已经被访问过,以避免在遍历中沿着反向边回到父节点。

下面以这两道题为例,介绍一下树形 DP 的一般解题思路。

2.2 二叉树中的最大路径和

2.2.1 题目链接

2.2.2 题目大意

描述:给定一个二叉树的根节点 rootroot

要求:返回其最大路径和。

说明

  • 路径:被定义为一条节点序列,序列中每对相邻节点之间都存在一条边。同一个节点在一条路径序列中至多出现一次。该路径至少包含一个节点,且不一定经过根节点。
  • 路径和:路径中各节点值的总和。
  • 树中节点数目范围是 [1,3104][1, 3 * 10^4]
  • 1000Node.val1000-1000 \le Node.val \le 1000

示例

  • 示例 1:
输入:root = [1,2,3]
输出:6
解释:最优路径是 2 -> 1 -> 3 ,路径和为 2 + 1 + 3 = 6
  • 示例 2:
输入:root = [-10,9,20,null,null,15,7]
输出:42
解释:最优路径是 15 -> 20 -> 7 ,路径和为 15 + 20 + 7 = 42

2.2.3 解题思路

思路 1:树形 DP + 深度优先搜索

根据最大路径和中对应路径是否穿过根节点,我们可以将二叉树分为两种:

  1. 最大路径和中对应路径穿过根节点。
  2. 最大路径和中对应路径不穿过根节点。

如果最大路径和中对应路径穿过根节点,则:该二叉树的最大路径和 = 左子树中最大贡献值 + 右子树中最大贡献值 + 当前节点值

而如果最大路径和中对应路径不穿过根节点,则:该二叉树的最大路径和 = 所有子树中最大路径和

即:该二叉树的最大路径和 = max(左子树中最大贡献值 + 右子树中最大贡献值 + 当前节点值,所有子树中最大路径和)

对此我们可以使用深度优先搜索递归遍历二叉树,并在递归遍历的同时,维护一个最大路径和变量 ansans

然后定义函数 def dfs(self, node): 计算二叉树中以该节点为根节点,并且经过该节点的最大贡献值。

计算的结果可能的情况有 22 种:

  1. 经过空节点的最大贡献值等于 00
  2. 经过非空节点的最大贡献值等于 当前节点值 + 左右子节点提供的最大贡献值中较大的一个。如果该贡献值为负数,可以考虑舍弃,即最大贡献值为 00

在递归时,我们先计算左右子节点的最大贡献值,再更新维护当前最大路径和变量。最终 ansans 即为答案。具体步骤如下:

  1. 如果根节点 rootroot 为空,则返回 00
  2. 递归计算左子树的最大贡献值为 leftmaxleft\underline{}max
  3. 递归计算右子树的最大贡献值为 rightmaxright\underline{}max
  4. 更新维护最大路径和变量,即 self.ans=max{self.ans,leftmax+rightmax+node.val}self.ans = max \lbrace self.ans, \quad left\underline{}max + right\underline{}max + node.val \rbrace
  5. 返回以当前节点为根节点,并且经过该节点的最大贡献值。即返回 当前节点值 + 左右子节点提供的最大贡献值中较大的一个
  6. 最终 self.ansself.ans 即为答案。
思路 1:代码
# Definition for a binary tree node.
# class TreeNode:
#     def __init__(self, val=0, left=None, right=None):
#         self.val = val
#         self.left = left
#         self.right = right
class Solution:
    def __init__(self):
        self.ans = float('-inf')
        
    def dfs(self, node):
        if not node:
            return 0
        left_max = max(self.dfs(node.left), 0)     # 左子树提供的最大贡献值
        right_max = max(self.dfs(node.right), 0)   # 右子树提供的最大贡献值

        cur_max = left_max + right_max + node.val  # 包含当前节点和左右子树的最大路径和
        self.ans = max(self.ans, cur_max)          # 更新所有路径中的最大路径和

        return max(left_max, right_max) + node.val # 返回包含当前节点的子树的最大贡献值

    def maxPathSum(self, root: Optional[TreeNode]) -> int:
        self.dfs(root)
        return self.ans
思路 1:复杂度分析
  • 时间复杂度O(n)O(n),其中 nn 是二叉树的节点数目。
  • 空间复杂度O(n)O(n)。递归函数需要用到栈空间,栈空间取决于递归深度,最坏情况下递归深度为 nn,所以空间复杂度为 O(n)O(n)

2.3 相邻字符不同的最长路径

2.3.1 题目链接

2.3.2 题目大意

描述:给定一个长度为 nn 的数组 parentparent 来表示一棵树(即一个连通、无向、无环图)。该树的节点编号为 0n10 \sim n - 1,共 nn 个节点,其中根节点的编号为 00。其中 parent[i]parent[i] 表示节点 ii 的父节点,由于节点 00 是根节点,所以 parent[0]==1parent[0] == -1。再给定一个长度为 nn 的字符串,其中 s[i]s[i] 表示分配给节点 ii 的字符。

要求:找出路径上任意一对相邻节点都没有分配到相同字符的最长路径,并返回该路径的长度。

说明

  • n==parent.length==s.lengthn == parent.length == s.length
  • 1n1051 \le n \le 10^5
  • 对所有 i1i \ge 10parent[i]n10 \le parent[i] \le n - 1 均成立。
  • parent[0]==1parent[0] == -1
  • parentparent 表示一棵有效的树。
  • ss 仅由小写英文字母组成。

示例

  • 示例 1:
输入:parent = [-1,0,0,1,1,2], s = "abacbe"
输出:3
解释:任意一对相邻节点字符都不同的最长路径是:0 -> 1 -> 3 。该路径的长度是 3 ,所以返回 3。
可以证明不存在满足上述条件且比 3 更长的路径。
  • 示例 2:
输入:parent = [-1,0,0,0], s = "aabc"
输出:3
解释:任意一对相邻节点字符都不同的最长路径是:2 -> 0 -> 3 。该路径的长度为 3 ,所以返回 3

2.3.3 解题思路

思路 1:树形 DP + 深度优先搜索

因为题目给定的是表示父子节点的 parentparent 数组,为了方便递归遍历相邻节点,我们可以根据 partentpartent 数组,建立一个由父节点指向子节点的有向图 graphgraph

如果不考虑相邻节点是否为相同字符这一条件,那么这道题就是在求树的直径(树的最长路径长度)中的节点个数。

对于根节点为 uu 的树来说:

  1. 如果其最长路径经过根节点 uu,则:最长路径长度 = 某子树中的最长路径长度 + 另一子树中的最长路径长度 + 1
  2. 如果其最长路径不经过根节点 uu,则:最长路径长度 = 某个子树中的最长路径长度

即:最长路径长度 = max(某子树中的最长路径长度 + 另一子树中的最长路径长度 + 1,某个子树中的最长路径长度)

对此,我们可以使用深度优先搜索递归遍历 uu 的所有相邻节点 vv,并在递归遍历的同时,维护一个全局最大路径和变量 ansans,以及当前节点 uu 的最大路径长度变量 ulenu\underline{}len

  1. 先计算出从相邻节点 vv 出发的最长路径长度 vlenv\underline{}len
  2. 更新维护全局最长路径长度为 self.ans=max(self.ans,ulen+vlen+1)self.ans = max(self.ans, \quad u\underline{}len + v\underline{}len + 1)
  3. 更新维护当前节点 uu 的最长路径长度为 ulen=max(ulen,vlen+1)u\underline{}len = max(u\underline{}len, \quad v\underline{}len + 1)

因为题目限定了「相邻节点字符不同」,所以在更新全局最长路径长度和当前节点 uu 的最长路径长度时,我们需要判断一下节点 uu 与相邻节点 vv 的字符是否相同,只有在字符不同的条件下,才能够更新维护。

最后,因为题目要求的是树的直径(树的最长路径长度)中的节点个数,而:路径的节点 = 路径长度 + 1,所以最后我们返回 self.ans+1self.ans + 1 作为答案。

思路 1:代码
class Solution:
    def longestPath(self, parent: List[int], s: str) -> int:
        size = len(parent)

        # 根据 parent 数组,建立有向图
        graph = [[] for _ in range(size)]
        for i in range(1, size):
            graph[parent[i]].append(i)

        ans = 0
        def dfs(u):
            nonlocal ans
            u_len = 0                                   # u 节点的最大路径长度
            for v in graph[u]:                          # 遍历 u 节点的相邻节点
                v_len = dfs(v)                          # 相邻节点的最大路径长度
                if s[u] != s[v]:                        # 相邻节点字符不同
                    ans = max(ans, u_len + v_len + 1)   # 维护最大路径长度
                    u_len = max(u_len, v_len + 1)       # 更新 u 节点的最大路径长度
            return u_len                                # 返回 u 节点的最大路径长度

        dfs(0)
        return ans + 1
思路 1:复杂度分析
  • 时间复杂度O(n)O(n),其中 nn 是树的节点数目。
  • 空间复杂度O(n)O(n)

3. 不定根的树形 DP

3.1 不定根的树形 DP 基本思路

不定根的树形 DP 问题,如果是二叉树,树通常是以一张 nn 个节点、n1n - 1 条边的无向图形式给出的,并且事先没有指定根节点。通常需要以「每个节点为根节点」进行一系列统计。

这种情况下,我们一般通过「两次扫描与换根法」的方法求解这类题目:

  1. 第一次扫描时,任选一个节点为根,在「有固定根的树」上执行一次树形 DP,预处理树的一些相关信息。
  2. 第二次扫描时,从刚才的根节点出发,对整棵树再执行一次深度优先搜索,同时携带根节点的一些信息提供给子节点进行推导,计算出「换根」之后的解。

3.2 最小高度树

3.2.1 题目链接

3.2.2 题目大意

描述:有一棵包含 nn 个节点的树,节点编号为 0n10 \sim n - 1。给定一个数字 nn 和一个有 n1n - 1 条无向边的 edgesedges 列表来表示这棵树。其中 edges[i]=[ai,bi]edges[i] = [ai, bi] 表示树中节点 aiaibibi 之间存在一条无向边。

可以选择树中的任何一个节点作为根,当选择节点 xx 作为根节点时,设结果树的高度为 hh。在所有可能的树种,具有最小高度的树(即 min(h)min(h))被成为最小高度树。

要求:找到所有的最小高度树并按照任意顺序返回他们的根节点编号列表。

说明

  • 树的高度:指根节点和叶子节点之间最长向下路径上边的数量。
  • 1n2×1041 \le n \le 2 \times 10^4
  • edges.length==n1edges.length == n - 1
  • 0ai,bi<n0 \le ai, bi < n
  • aibiai \ne bi
  • 所有 (ai,bi)(ai, bi) 互不相同。
  • 给定的输入保证是一棵树,并且不会有重复的边。

示例

  • 示例 1:
输入:n = 4, edges = [[1,0],[1,2],[1,3]]
输出:[1]
解释:如图所示,当根是标签为 1 的节点时,树的高度是 1 ,这是唯一的最小高度树。
  • 示例 2:
输入:n = 6, edges = [[3,0],[3,1],[3,2],[3,4],[5,4]]
输出:[3,4]

3.2.3 解题思路

思路 1:树形 DP + 二次遍历换根法

最容易想到的做法是:枚举 nn 个节点,以每个节点为根节点,然后进行深度优先搜索,求出每棵树的高度。最后求出所有树中的最小高度即为答案。但这种做法的时间复杂度为 O(n2)O(n^2),而 nn 的范围为 [1,2×104][1, 2 \times 10^4],这样做会导致超时,因此需要进行优化。

在上面的算法中,在一轮深度优先搜索中,除了可以得到整棵树的高度之外,在搜索过程中,其实还能得到以每个子节点为根节点的树的高度。如果我们能够利用这些子树的高度信息,快速得到以其他节点为根节点的树的高度,那么我们就能改进算法,以更小的时间复杂度解决这道题。这就是二次遍历与换根法的思想。

  1. 第一次遍历:自底向上的计算出每个节点 uu 向下走(即由父节点 uu 向子节点 vv 走)的最长路径 down1[u]down1[u]、次长路径 down2[i]down2[i],并记录向下走最长路径所经过的子节点 p[u]p[u],方便第二次遍历时计算。
  2. 第二次遍历:自顶向下的计算出每个节点 vv 向上走(即由子节点 vv 向父节点 uu 走)的最长路径 up[v]up[v]。需要注意判断 uu 向下走的最长路径是否经过了节点 vv
    1. 如果经过了节点 vv,则向上走的最长路径,取决于「父节点 uu 向上走的最长路径」与「父节点 uu 向下走的次长路径」 的较大值,再加上 11
    2. 如果没有经过节点 vv,则向上走的最长路径,取决于「父节点 uu 向上走的最长路径」与「父节点 uu 向下走的最长路径」 的较大值,再加上 11
  3. 接下来,我们通过枚举 nn 个节点向上走的最长路径与向下走的最长路径,从而找出所有树中的最小高度,并将所有最小高度树的根节点放入答案数组中并返回。

整个算法具体步骤如下:

  1. 使用邻接表的形式存储树。
  2. 定义第一个递归函数 dfs(u, fa) 用于计算每个节点向下走的最长路径 down1[u]down1[u]、次长路径 down2[u]down2[u],并记录向下走的最长路径所经过的子节点 p[u]p[u]
    1. 对当前节点的相邻节点进行遍历。
    2. 如果相邻节点是父节点,则跳过。
    3. 递归调用 dfs(v, u) 函数计算邻居节点的信息。
    4. 根据邻居节点的信息计算当前节点的高度,并更新当前节点向下走的最长路径 down1[u]down1[u]、当前节点向下走的次长路径 down2down2、取得最长路径的子节点 p[u]p[u]
  3. 定义第二个递归函数 reroot(u, fa) 用于计算每个节点作为新的根节点时向上走的最长路径 up[v]up[v]
    1. 对当前节点的相邻节点进行遍历。
    2. 如果相邻节点是父节点,则跳过。
    3. 根据当前节点 uu 的高度和相邻节点 vv 的信息更新 up[v]up[v]。同时需要判断节点 uu 向下走的最长路径是否经过了节点 vv
      1. 如果经过了节点 vv,则向上走的最长路径,取决于「父节点 uu 向上走的最长路径」与「父节点 uu 向下走的次长路径」 的较大值,再加上 11,即:up[v]=max(up[u],down2[u])+1up[v] = max(up[u], down2[u]) + 1
      2. 如果没有经过节点 vv,则向上走的最长路径,取决于「父节点 uu 向上走的最长路径」与「父节点 uu 向下走的最长路径」 的较大值,再加上 11,即:up[v]=max(up[u],down1[u])+1up[v] = max(up[u], down1[u]) + 1
    4. 递归调用 reroot(v, u) 函数计算邻居节点的信息。
  4. 调用 dfs(0, -1) 函数计算每个节点的最长路径。
  5. 调用 reroot(0, -1) 函数计算每个节点作为新的根节点时的最长路径。
  6. 找到所有树中的最小高度。
  7. 将所有最小高度的节点放入答案数组中并返回。
思路 1:代码
class Solution:
    def findMinHeightTrees(self, n: int, edges: List[List[int]]) -> List[int]:
        graph = [[] for _ in range(n)]
        for u, v in edges:
            graph[u].append(v)
            graph[v].append(u)
		
        # down1 用于记录向下走的最长路径 
        down1 = [0 for _ in range(n)]
        # down2 用于记录向下走的最长路径
        down2 = [0 for _ in range(n)]
        p = [0 for _ in range(n)]
        # 自底向上记录最长路径、次长路径
        def dfs(u, fa):
            for v in graph[u]:
                if v == fa:
                    continue
                # 自底向上统计信息
                dfs(v, u)                   
                height = down1[v] + 1
                if height >= down1[u]:
                    down2[u] = down1[u]
                    down1[u] = height
                    p[u] = v
                elif height > down2[u]:
                    down2[u] = height

        # 进行换根动态规划,自顶向下统计向上走的最长路径
        up = [0 for _ in range(n)]
        def reroot(u, fa):
            for v in graph[u]:
                if v == fa:
                    continue
                if p[u] == v:
                    up[v] = max(up[u], down2[u]) + 1
                else:
                    up[v] = max(up[u], down1[u]) + 1
                # 自顶向下统计信息
                reroot(v, u)                            

        dfs(0, -1)
        reroot(0, -1)

        # 找到所有树中的最小高度
        min_h = 1e9
        for i in range(n):
            min_h = min(min_h, max(down1[i], up[i]))

        # 将所有最小高度的节点放入答案数组中并返回
        res = []
        for i in range(n):
            if max(down1[i], up[i]) == min_h:
                res.append(i)

        return res
思路 1:复杂度分析
  • 时间复杂度O(n)O(n)
  • 空间复杂度O(n)O(n)

参考资料