algorithm-pattern-c/basic_algorithm/dp.md at master

动态规划

背景

先从一道题目开始~

给定一个三角形，找出自顶向下的最小路径和。每一步只能移动到下一行中相邻的结点上。

例如，给定三角形：

[
     [2],
    [3,4],
   [6,5,7],
  [4,1,8,3]
]

自顶向下的最小路径和为 11（即，2 + 3 + 5 + 1 = 11）。

使用 DFS（遍历或者分治法）

遍历

分治法

优化 DFS，缓存已经被计算的值（称为：记忆化搜索本质上：动态规划）

动态规划就是把大问题变成小问题，并解决了小问题重复计算的方法称为动态规划

动态规划和 DFS 区别

二叉树子问题是没有交集，所以大部分二叉树都用递归或者分治法，即 DFS，就可以解决
像 triangle 这种是有重复走的情况，子问题是有交集，所以可以用动态规划来解决

动态规划，自底向上

int minimumTotal(vector<vector<int>>& triangle) {
    if(triangle.size() == 0 || triangle[0].size() == 0) return 0;

    // 1、状态定义：f[i][j] 表示从i,j出发，到达最后一层的最短路径
    int l = triangle.size();
    // 2、初始化
    vector<vector<int>> f;
    for(int i = 0; i < l; i++){
        vector<int> g;
        for(int j = 0; j < triangle[i].size(); j++){
             g.push_back(triangle[i][j]);
        }
        f.push_back(g);
    }

    // 3、递推求解
    for(int i = triangle.size() - 2; i >= 0; i--){
        for(int j = 0; j < triangle[i].size(); j++){
            f[i][j] = min(f[i + 1][j], f[i + 1][j + 1]) + triangle[i][j];
        }
    }

    // 4、答案
    return f[0][0];
}

动态规划，自顶向下

// 测试用例：
// [
// [2],
// [3,4],
// [6,5,7],
// [4,1,8,3]
// ]
int minimumTotal(vector<vector<int>>& triangle) {
    if(triangle.size() == 0 || triangle[0].size() == 0) return 0;

    // 1、状态定义：f[i][j] 表示从0,0出发，到达i,j的最短路径
    int l = triangle.size();
    // 2、初始化
    vector<vector<int>> f;
    for(int i = 0; i < l; i++){
        vector<int> g;
        for(int j = 0; j < triangle[i].size(); j++){
             g.push_back(triangle[i][j]);
        }
        f.push_back(g);
    }

    // 3、递推求解
    for(int i = 1; i < l; i++){
        for(int j = 0; j < triangle[i].size(); j++){
            // 这里分为两种情况：
            // 1、上一层没有左边值
            // 2、上一层没有右边值
            if (j-1 < 0) {
                f[i][j] = f[i-1][j] + triangle[i][j];
            } else if (j >= f[i-1].size()) {
                f[i][j] = f[i-1][j-1] + triangle[i][j];
            } else {
                f[i][j] = min(f[i-1][j], f[i-1][j-1]) + triangle[i][j];
            }
        }
    }

    // 4、答案
    int result = f[l-1][0];
    for(int i = 1; i < f[l-1].size(); i++){
        result = min(f[l - 1][i], result);
    }

    return result;
}

优化空间复杂度:

int minimumTotal(vector<vector<int>>& triangle) {
     int n = triangle.size();
     vector<int> dp(n + 1);
     for(int i = n - 1; i >= 0; i--){
         for(int j = 0; j <= i; j++){
             dp[j] = min(dp[j], dp[j + 1]) + triangle[i][j];
         }
     }

     return dp[0];
}

递归和动规关系

递归是一种程序的实现方式：函数的自我调用

Function(x) {
	...
	Funciton(x-1);
	...
}

动态规划：是一种解决问题的思想，大规模问题的结果，是由小规模问题的结果运算得来的。动态规划可用递归来实现(Memorization Search)

使用场景

满足两个条件

满足以下条件之一
- 求最大/最小值（Maximum/Minimum ）
- 求是否可行（Yes/No ）
- 求可行个数（Count(*) ）
满足不能排序或者交换（Can not sort / swap ）

如题：longest-consecutive-sequence 位置可以交换，所以不用动态规划

四点要素

状态 State
- 灵感，创造力，存储小规模问题的结果
方程 Function
- 状态之间的联系，怎么通过小的状态，来算大的状态
初始化 Intialization
- 最极限的小状态是什么, 起点
答案 Answer
- 最大的那个状态是什么，终点

常见四种类型

Matrix DP (10%)
Sequence (40%)
Two Sequences DP (40%)
Backpack (10%)

注意点

贪心算法大多题目靠背答案，所以如果能用动态规划就尽量用动规，不用贪心算法

1、矩阵类型（10%）

minimum-path-sum

给定一个包含非负整数的 m x n 网格，请找出一条从左上角到右下角的路径，使得路径上的数字总和为最小。

思路：动态规划 1、state: f[x][y]从起点走到 x,y 的最短路径 2、function: f[x][y] = min(f[x-1][y], f[x][y-1]) + A[x][y] 3、intialize: f[0][0] = A[0][0]、f[i][0] = sum(0,0 -> i,0)、 f[0][i] = sum(0,0 -> 0,i) 4、answer: f[n-1][m-1]

int minPathSum(vector<vector<int>>& grid) {
    // 思路：动态规划
    // f[i][j] 表示i,j到0,0的和最小
    int row = grid.size(), col = grid[0].size();
    if(row == 0 || col == 0) return 0;

    // 复用原来的矩阵列表
    // 初始化：f[i][0]、f[0][j]
    for(int i = 1; i < row; i++){
        grid[i][0] += grid[i - 1][0];
    }      

    for(int j = 1; j < col; j++){
        grid[0][j] += grid[0][j - 1];
    }

    for(int i = 1; i < row; i++){
        for(int j = 1; j < col; j++){
            grid[i][j] = min(grid[i - 1][j], grid[i][j - 1]) + grid[i][j];
        }
    }

    return grid[row - 1][col - 1];
}

unique-paths

一个机器人位于一个 m x n 网格的左上角（起始点在下图中标记为“Start” ）。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角（在下图中标记为“Finish”）。问总共有多少条不同的路径？

int uniquePaths(int m, int n) {
    if(m == 0 || n == 0) return 1;

    vector<vector<int>> dp(m, vector<int>(n));
    for(int i = 0; i < m; i++){
        for(int j = 0; j < n; j++){
            if(i == 0 || j == 0) {
                dp[i][j] = 1;
            }else{
                dp[i][j] = dp[i - 1][j] + dp[i][j - 1];
            }
        }
    }

    return dp[m - 1][n - 1];
}

unique-paths-ii

一个机器人位于一个 m x n 网格的左上角（起始点在下图中标记为“Start” ）。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角（在下图中标记为“Finish”）。问总共有多少条不同的路径？现在考虑网格中有障碍物。那么从左上角到右下角将会有多少条不同的路径？

int uniquePathsWithObstacles(vector<vector<int>>& obstacleGrid) {
    if(obstacleGrid[0][0] == 1) return 0;
    // f[i][j] = f[i-1][j] + f[i][j-1] 并检查障碍物
    int m = obstacleGrid.size(), n = obstacleGrid[0].size();
    vector<vector<int>> f(m, vector<int>(n, 1));
    for(int i = 1; i < m; i++){
        if(obstacleGrid[i][0] == 1 || f[i - 1][0] == 0){
            f[i][0] = 0;
        } 
    }

    for(int i = 1; i < n; i++){
        if(obstacleGrid[0][i] == 1 || f[0][i - 1] == 0){
            f[0][i] = 0;
        }
    }

    for(int i = 1; i < m; i++){
        for(int j = 1; j < n; j++){
            if(obstacleGrid[i][j] == 1){
                f[i][j] = 0;
            }else{
                f[i][j] = f[i - 1][j] + f[i][j - 1];
            }
        }
    }

    return f[m - 1][n - 1];
}

优化空间:

int uniquePathsWithObstacles(vector<vector<int>>& obstacleGrid) {
    int n = obstacleGrid.size(), m = obstacleGrid.at(0).size();
    vector <int> f(m);

    f[0] = (obstacleGrid[0][0] == 0);
    for (int i = 0; i < n; ++i) {
        for (int j = 0; j < m; ++j) {
            if (obstacleGrid[i][j] == 1) {
                f[j] = 0;
                continue;
            }
            if (j - 1 >= 0 && obstacleGrid[i][j - 1] == 0) {
                f[j] += f[j - 1];
            }
        }
    }

    return f.back();  //相当于f[m - 1]
}

2、序列类型（40%）

climbing-stairs

假设你正在爬楼梯。需要 n 阶你才能到达楼顶。

int climbStairs(int n) {
    if(n < 3) return n;

    int a = 1, b = 2;
    for(int i = 3; i <= n; i++){
        int sum = a + b;
        a = b;
        b = sum;
    }

    return b;
}

jump-game

给定一个非负整数数组，你最初位于数组的第一个位置。数组中的每个元素代表你在该位置可以跳跃的最大长度。判断你是否能够到达最后一个位置。

bool canJump(vector<int>& nums) {
    int n = nums.size();
    int rightmost = 0;
    for (int i = 0; i < n; ++i) {
        if (i <= rightmost) {
            rightmost = max(rightmost, i + nums[i]);
            if (rightmost >= n - 1) {
                return true;
            }
        }
    }
    return false;
}

jump-game-ii

给定一个非负整数数组，你最初位于数组的第一个位置。数组中的每个元素代表你在该位置可以跳跃的最大长度。你的目标是使用最少的跳跃次数到达数组的最后一个位置。

int jump(vector<int>& nums) {
    int n = nums.size();
    if(n == 0) return 0;

    int ans = 0;
    int end = 0;
    int maxPos = 0;
    for(int i = 0; i < n - 1; i++){
        maxPos = max(maxPos, nums[i] + i);
        if(i == end){
            end = maxPos;
            ans++;
        }
    }

    return ans;
}

palindrome-partitioning-ii

给定一个字符串 s，将 s 分割成一些子串，使每个子串都是回文串。返回符合要求的最少分割次数。

int minCut(string s) {
    // state: f[i] "前i"个字符组成的子字符串需要最少几次cut(个数-1为索引)
	// function: f[i] = MIN{f[j]+1}, j < i && [j+1 ~ i]这一段是一个回文串
	// intialize: f[i] = i - 1 (f[0] = -1)
	// answer: f[s.length()]
    int n = s.size(); 
    if(n == 0 || n == 1) return 0;

    vector<int> f(n + 1);
    f[0] = -1;
    f[1] = 0;
    for(int i = 1; i <= n; i++){
        f[i] = i - 1;
        for(int j = 0; j < i; j++){
            if(isPalindrome(s, j, i - 1)){
                f[i] = min(f[i], f[j] + 1);
            }
        }
    }

    return f[n];
}

//注: 此处不用 & 会发生超时
bool isPalindrome(const string& s, int i, int j){
    while(i < j){
        if(s[i++] != s[j--]) return false;
    }
    return true;
}

注意点

判断回文字符串时，可以提前用动态规划算好，减少时间复杂度

longest-increasing-subsequence

给定一个无序的整数数组，找到其中最长上升子序列的长度。

int lengthOfLIS(vector<int>& nums) {
    // f[i] 表示从0开始到i结尾的最长序列长度
    // f[i] = max(f[j])+1 ,a[j]<a[i]
    // f[0...n-1] = 1
    // max(f[0]...f[n-1])
    int len = nums.size();
    if(len == 0 || len == 1) return len;
    
    vector<int> f(len);
    f[0] = 1;
    for(int i = 1; i < len; i++){
        f[i] = 1;
        for(int j = 0; j < i; j++){
            if(nums[j] < nums[i]){
                f[i] = max(f[i], f[j] + 1);
            }
        }
    }
    
    int result = f[0];
    for(int i = 1; i < f.size(); i++){
        result = max(result, f[i]);
    }
    return result;
}

word-break

给定一个非空字符串 s 和一个包含非空单词列表的字典 wordDict，判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词。

bool wordBreak(string s, vector<string>& wordDict) {
    unordered_set<string> wordDictSet;
    for(auto word : wordDict){
    wordDictSet.insert(word);
    }

    int len = s.size();    
    vector<bool> dp(len + 1);
    dp[0] = true;    //dp[0]=true 表示空串且合法
    for(int i = 1; i <= len; i++){
        for(int j = 0; j < i; j++){
            if(dp[j] && wordDictSet.find(s.substr(j, i - j)) != wordDictSet.end()){
                dp[i] = true;
                break;
            }
        }
    }

    return dp[len];
}

小结

常见处理方式是给 0 位置占位，这样处理问题时一视同仁，初始化则在原来基础上 length+1，返回结果 f[n]

状态可以为前 i 个
初始化 length+1
取值 index=i-1
返回值：f[n]或者 f[m][n]

Two Sequences DP（40%）

longest-common-subsequence

给定两个字符串 text1 和 text2，返回这两个字符串的最长公共子序列。一个字符串的子序列是指这样一个新的字符串：它是由原字符串在不改变字符的相对顺序的情况下删除某些字符（也可以不删除任何字符）后组成的新字符串。例如，"ace" 是 "abcde" 的子序列，但 "aec" 不是 "abcde" 的子序列。两个字符串的「公共子序列」是这两个字符串所共同拥有的子序列。

int longestCommonSubsequence(string text1, string text2) {
    // dp[i][j] a前i个和b前j个字符最长公共子序列
    // dp[m+1][n+1]
    //   ' a d c e
    // ' 0 0 0 0 0
    // a 0 1 1 1 1
    // c 0 1 1 2 1
    //
    int m = text1.size(), n = text2.size();
    vector<vector<int>> dp(m + 1, vector<int>(n + 1));

    for(int i = 1; i <= m; i++){
        for(int j = 1; j <= n; j++){
            if(text1[i - 1] == text2[j - 1]){
                // 相等取左上元素+1，否则取左或上的较大值
                dp[i][j] = dp[i - 1][j - 1] + 1;
            }else{
                dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
            }
        }
    }

    return dp[m][n];
}

注意点

c 切片初始化

  vector<vector<int>> dp(m + 1, vector<int>(n + 1));

从 1 开始遍历到最大长度
索引需要减一

edit-distance

给你两个单词 word1 和 word2，请你计算出将 word1 转换成 word2 所使用的最少操作数你可以对一个单词进行如下三种操作：插入一个字符删除一个字符替换一个字符

思路：和上题很类似，相等则不需要操作，否则取删除、插入、替换最小操作次数的值+1

int minDistance(string word1, string word2) {
    // dp[i][j] 表示a字符串的前i个字符编辑为b字符串的前j个字符最少需要多少次操作
    // dp[i][j] = OR(dp[i-1][j-1]，a[i]==b[j],min(dp[i-1][j],dp[i][j-1],dp[i-1][j-1])+1)
    int m = word1.size(), n = word2.size();
    vector<vector<int>> dp(m + 1, vector<int>(n + 1));
    for(int i = 0; i <= m; i++){
        dp[i][0] = i;
    }
    for(int i = 0; i <=n; i++){
        dp[0][i] = i;
    }

    for(int i = 1; i <= m; i++){
        for(int j = 1; j <= n; j++){
            if(word1[i - 1] == word2[j - 1]){
                // 相等则不需要操作
                dp[i][j] = dp[i - 1][j - 1]; 
            }else{
                // 否则取删除、插入、替换最小操作次数的值+1
                dp[i][j] = min(min(dp[i - 1][j], dp[i][j - 1]), dp[i - 1][j - 1]) + 1;
            }
        }
    }

    return dp[m][n];
}

说明

另外一种做法：MAXLEN(a,b)-LCS(a,b)

零钱和背包（10%）

coin-change

给定不同面额的硬币 coins 和一个总金额 amount。编写一个函数来计算可以凑成总金额所需的最少的硬币个数。如果没有任何一种硬币组合能组成总金额，返回 -1。

思路：和其他 DP 不太一样，i 表示钱或者容量

int coinChange(vector<int>& coins, int amount) {
    // 状态 dp[i]表示金额为i时，组成的最小硬币个数
    // 推导 dp[i]  = min(dp[i-1], dp[i-2], dp[i-5])+1, 前提 i-coins[j] > 0
    // 初始化为最大值 dp[i]=amount+1
    // 返回值 dp[n] or dp[n]>amount =>-1
    vector<int> dp(amount + 1, amount + 1);
    dp[0] = 0;
    for(int i = 1; i <= amount; i++){
        for(int j = 0; j < coins.size(); j++){
            if(i - coins[j] >= 0){
                dp[i] = min(dp[i], dp[i - coins[j]] + 1);
            }
        }
    }

    if(dp[amount] > amount){
        return -1;
    }

    return dp[amount];
}

注意

dp[i-a[j]] 决策 a[j]是否参与

backpack

在 n 个物品中挑选若干物品装入背包，最多能装多满？假设背包的大小为 m，每个物品的大小为 A[i]

int backPack(int m, vector<int> &A) {
    // f[i][j] 前i个物品，是否能装j
    // f[i][j] =f[i-1][j] f[i-1][j-a[i] j>a[i]
    // f[0][0]=true f[...][0]=true
    // f[n][X]
    int n = A.size();
    vector<vector<int>> f(n + 1, vector<int>(m + 1));
    
    f[0][0] = true;
    for(int i = 1; i <= n; i++){
        for(int j = 0; j <= m; j++){
            f[i][j] = f[i - 1][j];
            if(j - A[i - 1] >= 0 && f[i - 1][j - A[i - 1]]){
                f[i][j] = true;
            }
        }
    }
    
    for(int i = m; i >= 0; i--){
        if(f[n][i]) return i;
    }
    
    return 0;
}

backpack-ii

有 n 个物品和一个大小为 m 的背包. 给定数组 A 表示每个物品的大小和数组 V 表示每个物品的价值. 问最多能装入背包的总价值是多大?

思路：f[i][j] 前 i 个物品，装入 j 背包最大价值

int backPackII(int m, vector<int> &A, vector<int> &V) {
    // f[i][j] 前i个物品，装入j背包 最大价值
    // f[i][j] =max(f[i-1][j] ,f[i-1][j-A[i]]+V[i]) 是否加入A[i]物品
    // f[0][0]=0 f[0][...]=0 f[...][0]=0
    int n = A.size();
    vector<vector<int>> f(n + 1, vector<int>(m + 1));
    
    for(int i = 1; i <= n; i++){
        for(int j = 0; j <= m; j++){
            f[i][j] = f[i - 1][j];
            if(j - A[i - 1] >= 0){
                f[i][j] = max(f[i - 1][j], f[i - 1][j - A[i - 1]] + V[i - 1]);
            }
        }
    }
    
    return f[n][m];
}

练习

Matrix DP (10%)

Sequence (40%)

Two Sequences DP (40%)

Backpack & Coin Change (10%)