完全背包问题:有 n 种物品和一个最多能装重量为 W 的背包,第 i 种物品的重量为 weight[i],价值为 value[i],每种物品数量没有限制。请问在总重量不超过背包载重上限的情况下,能装入背包的最大价值是多少?
完全背包问题的特点:每种物品有无限件。
我们可以参考「0-1 背包问题」的状态定义和基本思路,对于容量为 w 的背包,最多可以装 weight[i−1]w 件第 i−1 件物品。那么我们可以多加一层循环,枚举第 i−1 件物品可以选择的件数(0∼weight[i−1]w),从而将「完全背包问题」转换为「0-1 背包问题」。
按照物品种类的序号、当前背包的载重上限进行阶段划分。
定义状态 dp[i][w] 表示为:前 i 种物品放入一个最多能装重量为 w 的背包中,可以获得的最大价值。
状态 dp[i][w] 是一个二维数组,其中第一维代表「当前正在考虑的物品种类」,第二维表示「当前背包的载重上限」,二维数组值表示「可以获得的最大价值」。
由于每种物品可选的数量没有限制,因此状态 dp[i][w] 可能从以下方案中选择最大值:
- 选择 0 件第 i−1 件物品:可以获得的最大价值为 dp[i−1][w]
- 选择 1 件第 i−1 件物品:可以获得的最大价值为 dp[i−1][w−weight[i−1]]+value[i−1]。
- 选择 2 件第 i−1 件物品:可以获得的最大价值为 dp[i−1][w−2×weight[i−1]]+2×value[i−1]。
- ……
- 选择 k 件第 i−1 件物品:可以获得的最大价值为 dp[i−1][w−k×weight[i−1]]+k×value[i−1]。
注意:选择 k 件第 i−1 件物品的条件是 0≤k×weight[i−1]≤w。
则状态转移方程为:
dp[i][w]=max{dp[i−1][w−k×weight[i−1]]+k×value[i−1]},0≤k×weight[i−1]≤w。
- 如果背包载重上限为 0,则无论选取什么物品,可以获得的最大价值一定是 0,即 dp[i][0]=0,0≤i≤size。
- 无论背包载重上限是多少,前 0 种物品所能获得的最大价值一定为 0,即 dp[0][w]=0,0≤w≤W。
根据我们之前定义的状态,dp[i][w] 表示为:前 i 种物品放入一个最多能装重量为 w 的背包中,可以获得的最大价值。则最终结果为 dp[size][W],其中 size 为物品的种类数,W 为背包的载重上限。
class Solution:
def completePackMethod1(self, weight: [int], value: [int], W: int):
size = len(weight)
dp = [[0 for _ in range(W + 1)] for _ in range(size + 1)]
for i in range(1, size + 1):
for w in range(W + 1):
for k in range(w // weight[i - 1] + 1):
dp[i][w] = max(dp[i][w], dp[i - 1][w - k * weight[i - 1]] + k * value[i - 1])
return dp[size][W]
- 时间复杂度:O(n×W×∑weight[i]W),其中 n 为物品种类数量,W 为背包的载重上限,weight[i] 是第 i 种物品的重量。
- 空间复杂度:O(n×W)。
上之前的思路中,对于每种物品而言,每次我们都需要枚举所有可行的物品数目 k,这就大大增加了时间复杂度。
实际上,我们可以对之前的状态转移方程进行一些优化,从而减少一下算法的时间复杂度。
我们将之前的状态转移方程
dp[i][w]=max{dp[i−1][w−k×weight[i−1]]+k×value[i−1]},0≤k×weight[i−1]≤w
进行展开:
(1)dp[i][w]=max⎩⎨⎧dp[i−1][w]dp[i−1][w−weight[i−1]]+value[i−1]dp[i−1][w−2×weight[i−1]]+2×value[i−1]……dp[i−1][w−k×weight[i−1]]+k×value[i−1],0≤k×weight[i−1]≤w
而对于 dp[i][w−weight[i−1]] 我们有:
(2)dp[i][w−weight[i−1]]=max⎩⎨⎧dp[i−1][w−weight[i−1]]dp[i−1][w−2×weight[i−1]]+value[i−1]dp[i−1][w−3×weight[i−1]]+2×value[i−1]……dp[i−1][w−k×weight[i−1]]+(k−1)×value[i−1],weight[i−1]≤k×weight[i−1]≤w
通过观察可以发现:
- (1) 式中共有 k+1 项,(2) 式中共有 k 项;
- (2) 式整个式子与 (1) 式第 1∼k+1 项刚好相差一个 value[i−1]。
则我们将 (2) 式加上 value[i−1],再代入 (1) 式中,可得到简化后的「状态转移方程」为:
(3)dp[i][w]=max{dp[i−1][w],dp[i][w−weight[i−1]]+value[i−1]},0≤weight[i−1]≤w。
简化后的「状态转移方程」去除了对物品件数的依赖,也就不需要遍历 k 了,三层循环降为了两层循环。
注意:式 (3) 的满足条件为 0≤weight[i−1]≤w。当 w<weight[i−1] 时,dp[i][w]=dp[i−1][w]。
则状态转移方程为:
dp[i][w]={dp[i−1][w]max{dp[i−1][w],dp[i][w−weight[i−1]]+value[i−1]}w<weight[i−1]w≥weight[i−1]
从上述状态转移方程我们可以看出:该式子与 0-1 背包问题中「思路 1」的状态转移式极其相似。
唯一区别点在于:
- 0-1 背包问题中状态为 dp[i−1][w−weight[i−1]]+value[i−1],这是第 i−1 阶段上的状态值。
- 完全背包问题中状态为 dp[i][w−weight[i−1]]+value[i−1],这是第 i 阶段上的状态值。
按照物品种类的序号、当前背包的载重上限进行阶段划分。
定义状态 dp[i][w] 表示为:前 i 种物品放入一个最多能装重量为 w 的背包中,可以获得的最大价值。
状态 dp[i][w] 是一个二维数组,其中第一维代表「当前正在考虑的物品种类」,第二维表示「当前背包的载重上限」,二维数组值表示「可以获得的最大价值」。
dp[i][w]={dp[i−1][w]max{dp[i−1][w],dp[i][w−weight[i−1]]+value[i−1]}w<weight[i−1]w≥weight[i−1]
- 如果背包载重上限为 0,则无论选取什么物品,可以获得的最大价值一定是 0,即 dp[i][0]=0,0≤i≤size。
- 无论背包载重上限是多少,前 0 种物品所能获得的最大价值一定为 0,即 dp[0][w]=0,0≤w≤W。
根据我们之前定义的状态,dp[i][w] 表示为:前 i 种物品放入一个最多能装重量为 w 的背包中,可以获得的最大价值。则最终结果为 dp[size][W],其中 size 为物品的种类数,W 为背包的载重上限。
class Solution:
def completePackMethod2(self, weight: [int], value: [int], W: int):
size = len(weight)
dp = [[0 for _ in range(W + 1)] for _ in range(size + 1)]
for i in range(1, size + 1):
for w in range(W + 1):
if w < weight[i - 1]:
dp[i][w] = dp[i - 1][w]
else:
dp[i][w] = max(dp[i - 1][w], dp[i][w - weight[i - 1]] + value[i - 1])
return dp[size][W]
- 时间复杂度:O(n×W),其中 n 为物品种类数量,W 为背包的载重上限。
- 空间复杂度:O(n×W)。
通过观察「思路 2」中的状态转移方程
dp[i][w]={dp[i−1][w]max{dp[i−1][w],dp[i][w−weight[i−1]]+value[i−1]}w<weight[i−1]w≥weight[i−1]
可以看出:我们只用到了当前行(第 i 行)的 dp[i][w]、dp[i][w−weight[i−1]],以及上一行(第 i−1 行)的 dp[i−1][w]。
所以我们没必要保存所有阶段的状态,只需要使用一个一维数组 dp[w] 保存上一阶段的所有状态,采用使用「滚动数组」的方式对空间进行优化(去掉动态规划状态的第一维)。
按照当前背包的载重上限进行阶段划分。
定义状态 dp[w] 表示为:将物品装入最多能装重量为 w 的背包中,可以获得的最大价值。
dp[w]={dp[w]max{dp[w],dp[w−weight[i−1]]+value[i−1]}w<weight[i−1]w≥weight[i−1]
注意:这里的 dp[w−weight[i−1]] 是第 i 轮计算之后的「第 i 阶段的状态值」。
因为在计算 dp[w] 时,我们需要用到第 i 轮计算之后的 dp[w−weight[i−1]],所以我们需要按照「从 0∼W 正序递推的方式」递推 dp[w],这样才能得到正确的结果。
因为 w<weight[i−1] 时,dp[w] 只能取上一阶段的 dp[w],其值相当于没有变化,这部分可以不做处理。所以我们在正序递推 dp[w] 时,只需从 weight[i−1] 开始遍历即可。
- 无论背包载重上限为多少,只要不选择物品,可以获得的最大价值一定是 0,即 dp[w]=0,0≤w≤W。
根据我们之前定义的状态, dp[w] 表示为:将物品装入最多能装重量为 w 的背包中,可以获得的最大价值。则最终结果为 dp[W],其中 W 为背包的载重上限。
class Solution:
def completePackMethod3(self, weight: [int], value: [int], W: int):
size = len(weight)
dp = [0 for _ in range(W + 1)]
for i in range(1, size + 1):
for w in range(weight[i - 1], W + 1):
dp[w] = max(dp[w], dp[w - weight[i - 1]] + value[i - 1])
return dp[W]
通过观察「0-1 背包问题滚动数组优化的代码」和「完全背包问题滚动数组优化的代码」可以看出,两者的唯一区别在于:
- 0-1 背包问题滚动数组优化的代码采用了「从 W∼weight[i−1] 逆序递推的方式」。
- 完全背包问题滚动数组优化的代码采用了「从 weight[i−1]∼W 正序递推的方式」。
- 时间复杂度:O(n×W),其中 n 为物品种类数量,W 为背包的载重上限。
- 空间复杂度:O(W)。