【算法学习】再谈回溯法-技术圈

再谈回溯法

当当当，我又来了，这次又是临时工~

众所周知，我们老板最近很忙，

这也就是拉我来当临时工的原因啦。

嗯，习惯了老板文章的老观众可能会觉得我的内容比较简单，

请不要介意，我会努力学习做出更优秀的内容的。。。

还是继续邀请新手一起来学习算法，

这次讲的是老板在两年前写过的算法——

回溯法。

在此感谢老板，参考了他的文章，老板赛高，老板赛高。

那么我在这里尝试从不同的角度讲，

大家也可以点击链接看看老板过去写的文章↓↓↓↓

【算法进阶】用回溯法(backtracking algorithm)求解N皇后问题(N-Queens puzzle)

话说多了，那么就开始吧。

01.回溯法介绍

02.01背包：子集树

03.旅行收获商：排序树

04.总结

壹

回溯法介绍

回溯法，又叫试探法，是一种寻找最优解的暴力搜寻法，也比较容易理解（适合小白学习）。但是，由于暴力，回溯法的时间复杂度较高，因此在比较一些数字较大的问题时，比如上次我们提到的最短路径问题等，运行时间一般比较长。

在回溯法中，深度优先搜索是一种很重要的工具——说到这是不是想起来上次的最短路径问题的DFS解法了？了解了DFS，就比较容易理解回溯法。

简单地介绍一下DFS，用一句话概括，就是“不撞南墙不回头”。（这句话也适用于回溯法）

它的基本思想是：

（1）某一种可能情况向前探索，并生成一个子节点。

（2）过程中，一旦发现原来的选择不符合要求，就回溯至父亲结点，然后重新选择另一方向，再次生成子结点，继续向前探索。

（3）如此反复进行，直至求得最优解。

我们再回到回溯法。

回溯法基本思想是：

（1）针对具体问题，定义问题的解空间；

（2）确定易于搜索的解空间结构（数据结构的选择）。

（3）一般以DFS的方式搜索解空间。

（4）在搜索过程中，可以使用剪枝函数等来优化算法。

是不是看到了几个生词？没关系，我们再解释一下。

解空间：顾名思义，就是一个问题的所有解的集合。（但别忘了，这离我们要求的最优解还差很远！）

剪枝函数：用约束函数和限界函数剪去得不到最优解的子树，统称为剪枝函数。

慢着，又多了几个生词！

别着急，我们继续看。

约束条件：有效解的要求，即题目的要求。

约束函数：减去不满足约束条件的子树的函数

限界函数：去掉得不到最优解的结点的函数

扩展结点：当前正在产生子结点的结点称为扩展结点

那么，为什么我们这里要提到树呢？

因为我们用回溯法处理的解空间常常可以分为这两种（或者说可以采取这两种方法）：

子集树：当所给问题是从集合中找出满足某种性质的子集时，相应的解空间树称为子集树。

排列树：当所给问题事从集合中确定满足某种性质的排列时，相应的解空间树称为排列树。

解释了这么多名词，相信大家对回溯法都有了一点基础的了解。但很多同学可能还有一个很大的问题：

回溯法到底和DFS有什么区别？

其实我认为吧，真没什么区别。真要说的话，DFS是一种遍历搜索图、树等数据结构的一种算法，更像一种工具；而回溯法则是为了解决问题不断地生成又放弃一些解决方案（解空间在搜索问题的过程中动态产生是回溯法的一个重要特点），直至找到最优解或搜索完毕为止的一种方法，更像一种指导思想，在解空间中利用DFS进行全面的搜索。

我觉得也没必要太纠结这两者的区别。。。（不是因为我搞不懂！！！）

还有就是关于优化的剪枝函数。

剪枝就是在搜索过程中利用过滤条件来剪去完全不用考虑（已经判断这条路走下去得不到最优解）的搜索路径，从而避免了一些不必要的搜索，优化算法求解速度，当然还必须得保证结果的正确性。

应用到回溯算法中，我们可以提前判断当前路径是否能产生结果集，如果否，就可以提前回溯。而这也叫做可行性剪枝。

另外还有一种叫做最优性剪枝，每次记录当前得到的最优值，如果当前结点已经无法产生比当前最优解更优的解时，可以提前回溯。

然而，剪枝的过滤条件不好找，想通过剪枝优化来提高算法高效性，又要保证结果正确性，还要保证剪枝的准确性。是非常难得的。哎，我太难了。。。

了解完回溯法的一些概念后，我们来就着题目讲解吧~~

贰

01背包：子集树

之前我们提到了，用回溯法处理解空间大致可以分为两种（当然也可以不用这两种），其中一种是子集树。01背包问题就是由子集树解决的一个经典问题。

我们贴一张图来说明：

因为我们考虑的是找子集，所以每个物品只有选与不选两种状态，因此解空间是一个二叉树。在这个树中，每一层的边表示对一个物品的选择与否。

举个例子，选择第一层点0与左边点1间的边，表示选择1号物品，也就是选择左子树走下去；如果不选择1号物品入包，则进入右子树，选择右边点1。那么，一共有n件物品，就有n层的边，n+1层点。最后一层的每一个叶结点分别表示一种选择法，一共有2^个叶结点，即解空间中共有2^n种解，我们要在这些叶结点中选择最佳结点。

我们先给出利用回溯法搜索子树集的伪代码框架：

void search(层数)

{

If(搜索到最底层)

打印出结果解;

Else for(遍历当前层解)

{

If(合适解)继续搜索;

撤消当前状态的影响;//回溯

}

来看看题干：

01背包问题。

某舟同学打算去拜访某欣同学，他打算带一背包的巧克力作为礼物。他希望装进的巧克力总价值最高，这样可能比较好吃。然而小舟体力有限，巧克力包不能太重，只能有8kg。

可供选择的巧克力如下：

1 费列罗 4kg $4500

2 好时之点 5kg $5700

3 德芙 2kg $2250

4 Cudie（西班牙） 1kg $1100

5 自制 6kg $6700

（某欣不会介意巧克力太重太贵的）

玩笑开玩了。。。不知道看懂题目没？不懂也得懂~

回溯法讲究“暴力”。我们从暴力的角度思考，想把所有的尽量装满背包的搭配都找出来，标记每一种装法（每一个解）最大value，从而找到最优解。

我们从第一种巧克力开始装，然后找下一个，判断能否装入，再递归，到达边界，比较，记录较优解，回溯，继续往下找。。。循环。

从子集树的角度将，我们优先选择走左子树，也就是入包；当走到叶结点或不符合约束的重量条件时，回溯到父结点，进入右结点，最后遍历全树。

判断能否装入后可以用一个book数组来标记是否选择入包。（我第一次自己编时就忘了！！不断通过循环来调用寻找下一个结点的函数，实在是太傻了，明明这个方法超级常用！！果然小白。。。）

再根据这个写出01背包问题的代码（注释中有详解，请放心食用）：

//01背包问题——回溯法子集树 #include using namespace std;
int n,bag_v,bag_w;int bag[100],x[100],w[100],val[100];
void search(int cur,int cur_v,int cur_w){   //search递归函数，当前current节点的价值为current value，重量为current weight     if(cur>n)   //判断边界       {        if(cur_v>bag_v)             //是否超过了最大价值        {            bag_v=cur_v;            //得到最大价值            for(int i=1;i<=n;i++)                      bag[i]=x[i];      //x表示当前是否被选中，将选中的物品存入bag中         }    }    else         for(int j=0;j<=1;j++)    //遍历当前解层:是否选择该物品         {            x[cur]=j;                  if(cur_w+x[cur]*w[cur]<=bag_w)   //满足重量约束,继续向前寻找配对             {                cur_w+=w[cur]*x[cur];                cur_v+=val[cur]*x[cur];                search(cur+1,cur_v,cur_w);//递归，下一件物品                 //清楚痕迹，回溯上一层                 cur_w-=w[cur]*x[cur];                   cur_v-=val[cur]*x[cur];                x[cur]=0;            }        }}
int main(){    int i;    bag_v=0; //初始化背包最大价值    //输入数据     cout<<"请输入背包最大容量:"<<endl;;    cin>>bag_w;    cout<<"请输入物品个数:"<<endl;    cin>>n;    cout<<"请依次输入物品的重量:"<<endl;    for(i=1;i<=n;i++)         cin>>w[i];    cout<<"请依次输入物品的价值:"<<endl;    for(i=1;i<=n;i++)         cin>>val[i];    search(1,0,0);    cout<<"最大价值为:"<<endl;    cout<endl;    cout<<"物品的编号依次为:"<<endl;
    for(i=1;i<=n;i++)        if(bag[i]==1)             cout<" ";    cout<<endl;        return 0;}

我们再来略微讲解一下如何优化。

我们可以用一个上界函数bound():当前价值+剩余容量可容纳的最大价值，去和目前的背包最大价值（也就是最优解）比较，如果bound（）更小，那就没有继续搜索的意义了，剪去左子树，即不选择当前物品，进入右子树。

因为物品只有选与不选2个决策，而总共有n个物品，所以时间复杂度为O（2^n）。

因为递归栈最多达到n层，而且存储所有物品的信息也只需要常数个一维数组，所以最终的空间复杂度为O(n)。

那么，我们如何计算这个“剩余容量可容纳的最大价值”呢？

首先，我们先将物品按照其单位重量价值从大到小排序，此后就按照顺序考虑各个物品。

接下来，我们贴代码讲解。（对不起我也是网上看来的呜呜呜）

    if(cur_w+w[cur]<=bag_w)//将物品cur放入背包,搜索左子树,即选择当前物品     {        cur_w+=w[cur];//同步更新当前背包的重量        cur_v+=val[cur];//同步更新当前背包的总价值        put[cur]=1;        search(cur+1,cur_v,cur_w);//深度搜索进入下一层        cur_w-=w[cur];//回溯复原        cur_v-=val[cur];//回溯复原    }    if(bound(cur+1,cur_v,cur_w)>bag_v)//如若符合条件则搜索右子树,即不选择当前物品   {        put[cur]=0;        search(cur+1,cur_v,cur_w);    }

当i<=n，重量超过限制时，leftw为负，我们得到的是一个达不到的理想最大价值，因为此时最后放入的物品单位价值较高，但无法完全塞进书包，我们就去掉多余的部分，只取一部分该物体入包。当然，这是做不到的。因此计算出的值是一个达不到的理想值。

当i>n，重量未超过限制时，则是可达到的最大价值。

这样就解释了这个上界函数的优化。可以看出，这是一个最优性剪枝优化，判断当前结点是否有机会产生更优解。

总代码：

//01背包问题优化#include using namespace std;
int n,bag_v,bag_w;int bag[100],put[100],w[100],val[100],order[100];double perp[100]; 
//按照单位重量价值排序，这里用冒泡 void bubblesort(){    int i,j;    int temporder = 0;    double temp = 0.0;    for(i=1;i<=n;i++)        perp[i]=val[i]/w[i]; //计算单位价值（单位重量的物品价值）    for(i=1;i<=n-1;i++)    {        for(j=i+1;j<=n;j++)            if(perp[i]//冒泡排序perp[],order[],sortv[],sortw[]        {            temp = perp[i];  //冒泡对perp[]排序交换             perp[i]=perp[i];            perp[j]=temp;            temporder=order[i];//冒泡对order[]交换             order[i]=order[j];            order[j]=temporder;            temp = val[i];//冒泡对val[]交换             val[i]=val[j];            val[j]=temp;            temp=w[i];//冒泡对w[]交换             w[i]=w[j];            w[j]=temp;        }    }}
//计算上界函数，功能为剪枝double bound(int i,int cur_v,int cur_w){   //判断当前背包的总价值cur_v＋剩余容量可容纳的最大价值<=当前最优价值    double leftw= bag_w-cur_w;//剩余背包容量    double b = cur_v;//记录当前背包的总价值cur_v,最后求上界        //以物品单位重量价值递减次序装入物品    while(i<=n && w[i]<=leftw)    {        leftw-=w[i];        b+=val[i];        i++;    }    //装满背包    if(i<=n)        b+=val[i]/w[i]*leftw;    return b;//返回计算出的上界}
void search(int cur,int cur_v,int cur_w){   //search递归函数，当前current节点的价值为current value，重量为current weight     if(cur>n)   //判断边界       {        if(cur_v>bag_v)             //是否超过了最大价值        {            bag_v=cur_v;            //得到最大价值            for(int i=1;i<=n;i++)                      bag[order[i]]=put[i];      //put表示当前是否被选中，将选中的物品存入bag中         }    }    //如若左子节点可行，则直接搜索左子树;    //对于右子树，先计算上界函数，以判断是否将其减去    if(cur_w+w[cur]<=bag_w)//将物品cur放入背包,搜索左子树,即选择当前物品     {        cur_w+=w[cur];//同步更新当前背包的重量        cur_v+=val[cur];//同步更新当前背包的总价值        put[cur]=1;        search(cur+1,cur_v,cur_w);//深度搜索进入下一层        cur_w-=w[cur];//回溯复原        cur_v-=val[cur];//回溯复原    }    if(bound(cur+1,cur_v,cur_w)>bag_v)//如若符合条件则搜索右子树,即不选择当前物品   {        put[cur]=0;        search(cur+1,cur_v,cur_w);    }}
int main(){    int i;    bag_v=0; //初始化背包最大价值    //输入数据     cout<<"请输入背包最大容量:"<<endl;;    cin>>bag_w;    cout<<"请输入物品个数:"<<endl;    cin>>n;    cout<<"请依次输入物品的重量:"<<endl;    for(i=1;i<=n;i++)         cin>>w[i];    cout<<"请依次输入物品的价值:"<<endl;    for(i=1;i<=n;i++)         cin>>val[i];    for (i=1;i<=n;i++)  //新增的order数组，存储初始编号         order[i]=i;    search(1,0,0);    cout<<"最大价值为:"<<endl;    cout<endl;    cout<<"物品的编号依次为:"<<endl;
    for(i=1;i<=n;i++)        if(bag[i]==1)             cout<" ";    cout<<endl;    return 0;}

叁

旅行售货员：排序树

讲完子集树，我们再讲讲排序树。排列树与子集树最大的区别在于，子集树的解是无序的子集，而排列树的解则包含整个集合的所有元素，我们从暴力的原则出发，将元素进行全排列。

我们再贴出排序树的图。

｛｝外的数表示已经排好序，｛｝内的数尚未排序。

在排序树中，每一层选择一个数字排到队尾，因此对一个n元素的集合，树的第一层将有n个子结点，表示可选n个数放在队伍的第一个位置，一次分叉比前一次减少一个（因为已经确定了一个位置的元素）；

树共有n+1层（图中省略了最后一层），表示选择n次；

叶结点共有n！个，表示组合数A，全排列共有n！种情形（因此时间复杂度也是n！）。

我们再给出算法框架（这次换英文了~保持新鲜感）：

void backtrack(int t)

{

if(t>n)

output(x)

else

{

for(int i=t;i<=n;i++)

{

swap(x[t],x[i]);

if(constraint(t)&&bound(t))//

backtrack(t+1)

swap(x[i],x[t]);

}

这里的swap是一个交换函数，对于一个排列，只要交换任意两数后就是一个新排列。constraint（）和bound（）分别是约束条件和限定函数（用于剪枝优化）。

为什么要用swap来交换，而不是把数据放入新数组啦等等什么别的操作呢？

这是因为，当我们在原先存储数据的数组x内进行交换时，我们把排好序的元素放到了数组的前面，留下的数据则是未排序的。这样在我们进行for循环的时候就能从t开始，同时避免了重复遇到排过序的数，也不需要book记录等多余的代码。

差不多了解了排序树的概念和回溯法在排序树中的框架，我们就来看题目啦。

旅行售货员问题（TSP）：

某舟同学在去小欣同学那前想了一想，准备顺便拜访各高校的高中同学。他打算从本校出发，途径高中同学所在的一些高校，最终回到自己学校。小舟很懒，希望只走最短的路，同时不想在一个学校玩第二次，因为他们不是主要目标。怎么满足贪得无厌的小舟，制定一个旅行方案？

继续开玩笑。。。别介意~~

回到正题，乍一看这个题目是不是和最短路径问题很像？但很可惜的是，最短路径不要求通过每一个点，还是有所不同。

关键词：最短，每点一次，闭合回路。

（但学过的知识还是有用的：比方说我们可以用上次学过的邻接矩阵来存储图的内容。）

在这个问题中，我们的解空间就是所有城市的全排列，即走过每一个城市的顺序，因此可以用排序树来考虑这个问题。

放码：

//旅行售货员问题——回溯法排序树 #include using namespace std; int n,t; int dis[100][100],x[100],bestroad[100];  int cur_dis,bestdis; const int INF=99999; void swap(int&a,int&b)  //swap函数，交换 {   int temp;   temp=a;   a=b;   b=temp; } void backtrack(int t)   {   if (t==n)     { //判断边界。很长的判断 ，不能到自己或到不了，要比当前最优解短        if (dis[x[n - 1]][x[n]] != 0 && dis[x[n]][1] != 0 &&(cur_dis + dis[x[n - 1]][x[n]] + dis[x[n]][1] < bestdis || bestdis == 0))            {  //记录最优路径，最优距离              for (int j=1;j<=n;j++)                    bestroad[j]=x[j];             bestdis=cur_dis+ dis[x[n - 1]][x[n]] + dis[x[n]][1];             return;         }     }  else     {    for (int j=t;j<=n;j++)       {         if(dis[x[t]][x[j]]!=0&& (cur_dis + dis[x[t - 1]][x[t]] + dis[x[t]][1] < bestdis || bestdis == 0))             {               swap(x[t],x[j]);               cur_dis+=dis[x[t]][x[t-1]];               backtrack(t+1);               //回溯                cur_dis-=dis[x[t]][x[t-1]];               swap(x[t],x[j]);           }       }     } } int main(){    int i,j,m,a,b,c;    cout<<"输入城市数:"<<endl;    cin>>n;     cout<<"输入路径数:"<<endl;     cin>>m;    //初始化邻接矩阵    for(i=1;i<=n;i++)        for(j=1;j<=n;j++)            dis[i][j]=0;      cout<<"输入路径与距离:"<<endl;      //读入城市之间的距离    for(i=1;i<=m;i++)    {     cin>>a>>b>>c;      dis[a][b]=dis[b][a]=c; //无向图，两边都记录     }    for(i = 1; i <= n; i++)       x[i] = i;    backtrack(2);        cout<<"最佳路径为:";    for (i=1;i<=n;i++)            cout<" --> ";    cout<<"1"<<endl;    cout<<"最短距离为:"<    return 0; }

代码中有一些细节：

不同于最短路径，这里我们把INF（即无路径连通）与0（即自身）放在一起处理，因为他们都不需要swap。

我们用t==n，而不是t>=n，是为了防止数组下表越界。

然而，当我们想用剪枝函数优化时，发现其实没什么好方法。。。

再一次说明了通过剪枝函数优化是不容易的。（当然，对TSP问题还有许多方法，针对这个问题老板也写过很多文章哦，可以在公众号内查询，老板赛高）

肆

简单总结

在总结之前，我们再提提老板2年前（好强！）写的N皇后问题。

在那个问题中，老板没有用子集树或排序树。因为本就不止这些方法。

但N皇后问题确实可以用这两种数据结构来写。这里就不再写了，再写我就要死了。有兴趣的盆友可以自行搜索。

那么，终于到了激动人心的总结时间。（也就是完稿时间）

回溯法作为一种极暴力的搜索法，其时间复杂度是极高的，子集树大概是2^n，排序树大概是n！，所以处理大的问题不太给力。

但作为回报，它能给出真正的最优解。

回溯法的子集树和排序树，可以处理两类问题，求子集最优和排序最优。

想要利用剪枝函数优化是非常困难的。（亲身经历）

那么，本次总结就这样水一水啦~~飘走~~

写下最后这个TSP真是感慨万分啊！

在20多天前，我问老板：怎么学算法？我新手，不懂啊。你文章里题目太难了。

老板说：TSP很难吗，小老弟？

当时心态是绝望的(┬＿┬)

如今最起码能用暴力法写写了，不容易，不容易

特此纪念~~~（公号私用，砍了）

这里是新来的工人小舟，

正走在努力学习编程的路上。

让我们下次再见~

-The End-

文/怎么学都学不会C++的新手舟

版/怎么赶都赶不完作业的小白舟

码/新来到程序猿声的工人舟

审/这片工地的包工头短短的路走走停停