深入解析最長(zhǎng)公共子串
題目:如果字符串一的所有字符按其在字符串中的順序出現(xiàn)在另外一個(gè)字符串二中,則字符串一稱之為字符串二的子串。注意,并不要求子串(字符串一)的字符必須連續(xù)出現(xiàn)在字符串二中。請(qǐng)編寫一個(gè)函數(shù),輸入兩個(gè)字符串,求它們的最長(zhǎng)公共子串,并打印出最長(zhǎng)公共子串。
例如:輸入兩個(gè)字符串BDCABA和ABCBDAB,字符串BCBA和BDAB都是是它們的最長(zhǎng)公共子串,則輸出它們的長(zhǎng)度4,并打印任意一個(gè)子串。
分析:求最長(zhǎng)公共子串(Longest Common Subsequence, LCS)是一道非常經(jīng)典的動(dòng)態(tài)規(guī)劃題,因此一些重視算法的公司像MicroStrategy都把它當(dāng)作面試題。
完整介紹動(dòng)態(tài)規(guī)劃將需要很長(zhǎng)的篇幅,因此我不打算在此全面討論動(dòng)態(tài)規(guī)劃相關(guān)的概念,只集中對(duì)LCS直接相關(guān)內(nèi)容作討論。如果對(duì)動(dòng)態(tài)規(guī)劃不是很熟悉,請(qǐng)參考相關(guān)算法書比如算法討論。
考慮最長(zhǎng)公共子序列問題如何分解成子問題,設(shè)A=“a0,a1,…,am-1”,B=“b0,b1,…,bn-1”,并Z=“z0,z1,…,zk-1”為它們的最長(zhǎng)公共子序列。不難證明有以下性質(zhì):
(1) 如果am-1==bn-1,則zk-1=am-1=bn-1,且“z0,z1,…,zk-2”是“a0,a1,…,am-2”和“b0,b1,…,bn-2”的一個(gè)最長(zhǎng)公共子序列;
(2) 如果am-1!=bn-1,則若zk-1!=am-1時(shí),蘊(yùn)涵“z0,z1,…,zk-1”是“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一個(gè)最長(zhǎng)公共子序列;
(3) 如果am-1!=bn-1,則若zk-1!=bn-1時(shí),蘊(yùn)涵“z0,z1,…,zk-1”是“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一個(gè)最長(zhǎng)公共子序列。
這樣,在找A和B的公共子序列時(shí),如果有am-1==bn-1,則進(jìn)一步解決一個(gè)子問題,找“a0,a1,…,am-2”和“b0,b1,…,bm-2”的一個(gè)最長(zhǎng)公共子序列;如果am-1!=bn-1,則要解決兩個(gè)子問題,找出“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一個(gè)最長(zhǎng)公共子序列和找出“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一個(gè)最長(zhǎng)公共子序列,再取兩者中較長(zhǎng)者作為A和B的最長(zhǎng)公共子序列。
求解:
引進(jìn)一個(gè)二維數(shù)組c[][],用c[i][j]記錄X[i]與Y[j] 的LCS 的長(zhǎng)度,b[i][j]記錄c[i][j]是通過哪一個(gè)子問題的值求得的,以決定輸出最長(zhǎng)公共字串時(shí)搜索的方向。
我們是自底向上進(jìn)行遞推計(jì)算,那么在計(jì)算c[i,j]之前,c[i-1][j-1],c[i-1][j]與c[i][j-1]均已計(jì)算出來。此時(shí)我們根據(jù)X[i] == Y[j]還是X[i] != Y[j],就可以計(jì)算出c[i][j]。
問題的遞歸式寫成:
回溯輸出最長(zhǎng)公共子序列過程:
算法分析:
由于每次調(diào)用至少向上或向左(或向上向左同時(shí))移動(dòng)一步,故最多調(diào)用(m + n)次就會(huì)遇到i = 0或j = 0的情況,此時(shí)開始返回。返回時(shí)與遞歸調(diào)用時(shí)方向相反,步數(shù)相同,故算法時(shí)間復(fù)雜度為Θ(m + n)。
完整的實(shí)現(xiàn)代碼如下:
/**
找出兩個(gè)字符串的最長(zhǎng)公共子串的長(zhǎng)度
** author :liuzhiwei
** data :2011-08-15
**/
#include "stdio.h"
#include "string.h"
#include "stdlib.h"
int LCSLength(char* str1, char* str2, int **b)
{
int i,j,length1,length2,len;
length1 = strlen(str1);
length2 = strlen(str2);
//雙指針的方法申請(qǐng)動(dòng)態(tài)二維數(shù)組
int **c = new int*[length1+1]; //共有l(wèi)ength1+1行
for(i = 0; i < length1+1; i++)
c[i] = new int[length2+1]; //共有l(wèi)ength2+1列
for(i = 0; i < length1+1; i++)
c[i][0]=0; //第0列都初始化為0
for(j = 0; j < length2+1; j++)
c[0][j]=0; //第0行都初始化為0
for(i = 1; i < length1+1; i++)
{
for(j = 1; j < length2+1; j++)
{
if(str1[i-1]==str2[j-1]) //由于c[][]的0行0列沒有使用,c[][]的第i行元素對(duì)應(yīng)str1的第i-1個(gè)元素
{
c[i][j]=c[i-1][j-1]+1;
b[i][j]=0; //輸出公共子串時(shí)的搜索方向
}
else if(c[i-1][j]>c[i][j-1])
{
c[i][j]=c[i-1][j];
b[i][j]=1;
}
else
{
c[i][j]=c[i][j-1];
b[i][j]=-1;
}
}
}
/*
for(i= 0; i < length1+1; i++)
{
for(j = 0; j < length2+1; j++)
printf("%d ",c[i][j]);
printf("\n");
}
*/
len=c[length1][length2];
for(i = 0; i < length1+1; i++) //釋放動(dòng)態(tài)申請(qǐng)的二維數(shù)組
delete[] c[i];
delete[] c;
return len;
}
void PrintLCS(int **b, char *str1, int i, int j)
{
if(i==0 || j==0)
return ;
if(b[i][j]==0)
{
PrintLCS(b, str1, i-1, j-1); //從后面開始遞歸,所以要先遞歸到子串的前面,然后從前往后開始輸出子串
printf("%c",str1[i-1]); //c[][]的第i行元素對(duì)應(yīng)str1的第i-1個(gè)元素
}
else if(b[i][j]==1)
PrintLCS(b, str1, i-1, j);
else
PrintLCS(b, str1, i, j-1);
}
int main(void)
{
char str1[100],str2[100];
int i,length1,length2,len;
printf("請(qǐng)輸入第一個(gè)字符串:");
gets(str1);
printf("請(qǐng)輸入第二個(gè)字符串:");
gets(str2);
length1 = strlen(str1);
length2 = strlen(str2);
//雙指針的方法申請(qǐng)動(dòng)態(tài)二維數(shù)組
int **b = new int*[length1+1];
for(i= 0; i < length1+1; i++)
b[i] = new int[length2+1];
len=LCSLength(str1,str2,b);
printf("最長(zhǎng)公共子串的長(zhǎng)度為:%d\n",len);
printf("最長(zhǎng)公共子串為:");
PrintLCS(b,str1,length1,length2);
printf("\n");
for(i = 0; i < length1+1; i++) //釋放動(dòng)態(tài)申請(qǐng)的二維數(shù)組
delete[] b[i];
delete[] b;
system("pause");
return 0;
}
程序的效果圖如下:
第二種方法為:
/**
找出兩個(gè)字符串的最長(zhǎng)公共子串的長(zhǎng)度
** author :liuzhiwei
** data :2011-08-15
**/
#include "stdio.h"
#include "string.h"
#include "stdlib.h"
int LCSLength(char* str1, char* str2) //求得兩個(gè)字符串的最大公共子串長(zhǎng)度并輸出公共子串
{
int i,j,length1,length2;
length1 = strlen(str1);
length2 = strlen(str2);
//雙指針的方法申請(qǐng)動(dòng)態(tài)二維數(shù)組
int **c = new int*[length1+1]; //共有l(wèi)ength1+1行
for(i = 0; i < length1+1; i++)
c[i] = new int[length2+1]; //共有l(wèi)ength2+1列
for(i = 0; i < length1+1; i++)
c[i][0]=0; //第0列都初始化為0
for(j = 0; j < length2+1; j++)
c[0][j]=0; //第0行都初始化為0
for(i = 1; i < length1+1; i++)
{
for(j = 1; j < length2+1; j++)
{
if(str1[i-1]==str2[j-1]) //由于c[][]的0行0列沒有使用,c[][]的第i行元素對(duì)應(yīng)str1的第i-1個(gè)元素
c[i][j]=c[i-1][j-1]+1;
else if(c[i-1][j]>c[i][j-1])
c[i][j]=c[i-1][j];
else
c[i][j]=c[i][j-1];
}
}
//輸出公共子串
char s[100];
int len,k;
len=k=c[length1][length2];
s[k--]='\0';
i=length1,j=length2;
while(i>0 && j>0)
{
if(str1[i-1]==str2[j-1])
{
s[k--]=str1[i-1];
i--;
j--;
}
else if(c[i-1][j]<c[i][j-1])
j--;
else
i--;
}
printf("最長(zhǎng)公共子串為:");
puts(s);
for(i = 0; i < length1+1; i++) //釋放動(dòng)態(tài)申請(qǐng)的二維數(shù)組
delete[] c[i];
delete[] c;
return len;
}
int main(void)
{
char str1[100],str2[100];
int length1,length2,len;
printf("請(qǐng)輸入第一個(gè)字符串:");
gets(str1);
printf("請(qǐng)輸入第二個(gè)字符串:");
gets(str2);
length1 = strlen(str1);
length2 = strlen(str2);
len=LCSLength(str1,str2);
printf("最長(zhǎng)公共子串的長(zhǎng)度為:%d\n",len);
system("pause");
return 0;
}
問題拓展:設(shè)A、B、C是三個(gè)長(zhǎng)為n的字符串,它們?nèi)∽酝怀?shù)大小的字母表。設(shè)計(jì)一個(gè)找出三個(gè)串的最長(zhǎng)公共子串的O(n^3)的時(shí)間算法。
思路:跟上面的求2個(gè)字符串的公共子串是一樣的思路,只不過這里需要?jiǎng)討B(tài)申請(qǐng)一個(gè)三維的數(shù)組,三個(gè)字符串的尾字符不同的時(shí)候,考慮的情況多一些而已。
/**
找出三個(gè)字符串的最長(zhǎng)公共子串的長(zhǎng)度
** author :liuzhiwei
** data :2011-08-15
**/
#include "stdio.h"
#include "string.h"
#include "stdlib.h"
int max1(int m,int n)
{
if(m>n)
return m;
else
return n;
}
int max2(int x,int y,int z,int k,int m,int n)
{
int max=-1;
if(x>max)
max=x;
if(y>max)
max=y;
if(z>max)
max=z;
if(k>max)
max=k;
if(m>max)
max=m;
if(n>max)
max=n;
return max;
}
int LCSLength(char* str1, char* str2, char* str3) //求得三個(gè)字符串的最大公共子串長(zhǎng)度并輸出公共子串
{
int i,j,k,length1,length2,length3,len;
length1 = strlen(str1);
length2 = strlen(str2);
length3 = strlen(str3);
//申請(qǐng)動(dòng)態(tài)三維數(shù)組
int ***c = new int**[length1+1]; //共有l(wèi)ength1+1行
for(i = 0; i < length1+1; i++)
{
c[i] = new int*[length2+1]; //共有l(wèi)ength2+1列
for(j = 0; j<length2+1; j++)
c[i][j] = new int[length3+1];
}
for(i = 0; i < length1+1; i++)
{
for(j = 0; j < length2+1; j++)
c[i][j][0]=0;
}
for(i = 0; i < length2+1; i++)
{
for(j = 0; j < length3+1; j++)
c[0][i][j]=0;
}
for(i = 0; i < length1+1; i++)
{
for(j = 0; j < length3+1; j++)
c[i][0][j]=0;
}
for(i = 1; i < length1+1; i++)
{
for(j = 1; j < length2+1; j++)
{
for(k = 1; k < length3+1; k++)
{
if(str1[i-1]==str2[j-1] && str2[j-1]==str3[k-1])
c[i][j][k]=c[i-1][j-1][k-1]+1;
else if(str1[i-1]==str2[j-1] && str1[i-1]!=str3[k-1])
c[i][j][k]=max1(c[i][j][k-1],c[i-1][j-1][k]);
else if(str1[i-1]==str3[k-1] && str1[i-1]!=str2[j-1])
c[i][j][k]=max1(c[i][j-1][k],c[i-1][j][k-1]);
else if(str2[j-1]==str3[k-1] && str1[i-1]!=str2[j-1])
c[i][j][k]=max1(c[i-1][j][k],c[i][j-1][k-1]);
else
{
c[i][j][k]=max2(c[i-1][j][k],c[i][j-1][k],c[i][j][k-1],c[i-1][j-1][k],c[i-1][j][k-1],c[i][j-1][k-1]);
}
}
}
}
len=c[length1][length2][length3];
for(i = 1; i < length1+1; i++) //釋放動(dòng)態(tài)申請(qǐng)的三維數(shù)組
{
for(j = 1; j < length2+1; j++)
delete[] c[i][j];
delete[] c[i];
}
delete[] c;
return len;
}
int main(void)
{
char str1[100],str2[100],str3[100];
int len;
printf("請(qǐng)輸入第一個(gè)字符串:");
gets(str1);
printf("請(qǐng)輸入第二個(gè)字符串:");
gets(str2);
printf("請(qǐng)輸入第三個(gè)字符串:");
gets(str3);
len=LCSLength(str1,str2,str3);
printf("最長(zhǎng)公共子串的長(zhǎng)度為:%d\n",len);
system("pause");
return 0;
}
程序的效果圖如下:
上一篇:c++中inline的用法分析
欄 目:C語言
本文標(biāo)題:深入解析最長(zhǎng)公共子串
本文地址:http://mengdiqiu.com.cn/a1/Cyuyan/4528.html
您可能感興趣的文章
- 01-10深入理解約瑟夫環(huán)的數(shù)學(xué)優(yōu)化方法
- 01-10深入二叉樹兩個(gè)結(jié)點(diǎn)的最低共同父結(jié)點(diǎn)的詳解
- 01-10數(shù)據(jù)結(jié)構(gòu)課程設(shè)計(jì)- 解析最少換車次數(shù)的問題詳解
- 01-10深入理解C++中常見的關(guān)鍵字含義
- 01-10深入Main函數(shù)中的參數(shù)argc,argv的使用詳解
- 01-10深入第K大數(shù)問題以及算法概要的詳解
- 01-10深入理解鏈表的各類操作詳解
- 01-10深入N皇后問題的兩個(gè)最高效算法的詳解
- 01-10深入理解二叉樹的非遞歸遍歷
- 01-10深入全排列算法及其實(shí)現(xiàn)方法


閱讀排行
- 1C語言 while語句的用法詳解
- 2java 實(shí)現(xiàn)簡(jiǎn)單圣誕樹的示例代碼(圣誕
- 3利用C語言實(shí)現(xiàn)“百馬百擔(dān)”問題方法
- 4C語言中計(jì)算正弦的相關(guān)函數(shù)總結(jié)
- 5c語言計(jì)算三角形面積代碼
- 6什么是 WSH(腳本宿主)的詳細(xì)解釋
- 7C++ 中隨機(jī)函數(shù)random函數(shù)的使用方法
- 8正則表達(dá)式匹配各種特殊字符
- 9C語言十進(jìn)制轉(zhuǎn)二進(jìn)制代碼實(shí)例
- 10C語言查找數(shù)組里數(shù)字重復(fù)次數(shù)的方法
本欄相關(guān)
- 04-02c語言函數(shù)調(diào)用后清空內(nèi)存 c語言調(diào)用
- 04-02func函數(shù)+在C語言 func函數(shù)在c語言中
- 04-02c語言的正則匹配函數(shù) c語言正則表達(dá)
- 04-02c語言用函數(shù)寫分段 用c語言表示分段
- 04-02c語言中對(duì)數(shù)函數(shù)的表達(dá)式 c語言中對(duì)
- 04-02c語言編寫函數(shù)冒泡排序 c語言冒泡排
- 04-02c語言沒有round函數(shù) round c語言
- 04-02c語言分段函數(shù)怎么求 用c語言求分段
- 04-02C語言中怎么打出三角函數(shù) c語言中怎
- 04-02c語言調(diào)用函數(shù)求fibo C語言調(diào)用函數(shù)求
隨機(jī)閱讀
- 04-02jquery與jsp,用jquery
- 08-05DEDE織夢(mèng)data目錄下的sessions文件夾有什
- 01-10SublimeText編譯C開發(fā)環(huán)境設(shè)置
- 01-10C#中split用法實(shí)例總結(jié)
- 01-11ajax實(shí)現(xiàn)頁面的局部加載
- 08-05織夢(mèng)dedecms什么時(shí)候用欄目交叉功能?
- 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
- 08-05dedecms(織夢(mèng))副欄目數(shù)量限制代碼修改
- 01-10delphi制作wav文件的方法
- 01-10使用C語言求解撲克牌的順子及n個(gè)骰子