SPOJ 1812 LCS2 - Longest Common Substring II (后缀自动机、状压DP)
手動博客搬家: 本文發表于20181217 23:54:35, 原地址https://blog.csdn.net/suncongbo/article/details/85058680
人生第一道后綴自動機。
說實話SAM我還沒學多么明白。
但是題還是要做的。
說起來這玩意真的很妙。可惜我智商低理解不了。
再次驗證了代碼能力菜到沒邊。hyw 30min寫完我寫2.5h.
題目鏈接 (洛谷)https://www.luogu.org/problemnew/show/SP1812
題目大意
給\(n\)個長度為\(l_i\)的小寫字母字符串,求它們的最長公共子串 (要求每個字符串都要出現。) \(n\le 10, l_i\le 10^5\)
題解
做法一 二分+hash判斷。\(O(L\log L\times n)\), 據說會TLE.
做法二 后綴數組。不會。
做法三 后綴自動機。用后綴自動機的有兩種做法做法一
首先考慮如何求兩個串\(A,B\)的\(LCS\). 對\(A\)串建出后綴自動機,用\(B\)串在上面匹配。
匹配時從頭到尾枚舉\(B\)的每一個字符,記錄當前\(A\)串后綴自動機的位置\(pos\)以及當前長度\(len\), 初始\(pos=rtn, len=0\) (\(rtn\)為根節點)
這樣我們可以處理\(n=2\)的情形。\(n>2\)?
對于\(A_2, A_3,...,A_n\)分別跑一次,每一個節點記錄一下匹配大小的最小值,然后求最大即可。每個點記錄的最小值是因為要求這個子串同時是這\(n\)個串的公共部分,求最大是對于合法的狀態求出最大值。
做完了。?
少了一步
觀察到\(n=2\)時\(A\)若長度較長的子串可以匹配,那么長度較短的子串也可以匹配。因此我們需要每做完一個串進行一遍更新:
做完了嗎?
我們發現實際上對每個點還有限制,就是\(mx[u]\le len[u]\).
真·做完了。
代碼
//Wrong Coding: //pos = fa[pos]; curl = len[pos]; Wrong Order //insertstr() len[np]=len[p]+1 Forgot #include<cstdio> #include<cstdlib> #include<cstring> #include<algorithm> #define llong long long using namespace std;const int N = 2e5; const int M = 3e5; const int S = 26; int son[N+3][S+3]; int fa[N+3]; int len[N+3]; char a[N+3]; char b[N+3]; int buc[N+3]; int oid[N+3]; int ans[N+3]; int mx[N+3]; int sz[N+3]; int lpos,siz,rtn,lena;void insertstr(char ch) {int p = lpos,np; siz++; np = lpos = siz; sz[np] = 1; len[np] = len[p]+1;for(; p && son[p][ch]==0; p=fa[p]) son[p][ch] = np;if(p==0) {fa[np] = rtn;}else{int q = son[p][ch];if(len[p]+1==len[q]) {fa[np] = q;}else{siz++; int nq = siz; len[nq] = len[p]+1;memcpy(son[nq],son[q],sizeof(son[q]));fa[nq] = fa[q]; fa[np] = fa[q] = nq;for(; p!=0 && son[p][ch]==q; p=fa[p]) son[p][ch] = nq;}} }void prework() {for(int i=1; i<=siz; i++) buc[len[i]]++;for(int i=1; i<=lena; i++) buc[i] += buc[i-1];for(int i=siz; i>=1; i--) oid[buc[len[i]]--] = i;for(int i=siz; i>=1; i--){int pos = oid[i];sz[fa[pos]] += sz[pos];} }void dfs(char str[],int lens) {int curl = 0,pos = rtn;for(int i=1; i<=lens; i++){while(pos && son[pos][str[i]-96]==0) {pos = fa[pos]; curl = len[pos];}if(pos) {curl++; pos = son[pos][str[i]-96]; mx[pos] = max(mx[pos],curl);}else {pos = rtn; curl = 0;}}for(int i=siz; i>=1; i--){int u = oid[i];if(fa[u]) {mx[fa[u]] = max(mx[fa[u]],min(mx[u],len[fa[u]]));}ans[u] = min(ans[u],mx[u]);mx[u] = 0;} }int main() {memset(ans,1,sizeof(ans));siz = 1; rtn = 1; lpos = 1;scanf("%s",a+1);lena = strlen(a+1);for(int i=1; i<=lena; i++) insertstr(a[i]-96);prework();while(scanf("%s",b+1)!=EOF){int lenb = strlen(b+1);dfs(b,lenb);}int fans = 0;for(int i=1; i<=siz; i++) {if(ans[i]<=5e6) fans = max(fans,ans[i]);}printf("%d\n",fans);return 0; }完了?沒有呢,還有做法二。做法二
我們考慮這個題的一個加強版:每次給\(n\)個串的一個子集,詢問這個子集內的串的\(LCS\). \(n\le 20, L\le 10^5, q\le 10^5\)
做法:\(n\)個串并起來建立廣義\(SAM\). 然后每個狀態記錄一個\(n\)位二進制數。對于第\(i\)個串先在其所到達狀態標記\(2^i\). 最后把標記沿著Parent樹從下往上更新一下,然后統計出每一個子集的答案,然后再用每個集合的答案更新它的子集的答案(注意避免\(O(3^n)\)會\(TLE\))即可。
時間復雜度\(O(2^nn+nL)\)
可以參考GDOI2017微信這道題。見DC巨佬的博客:https://www.cnblogs.com/dcdcbigbig/p/10135665.html (引用已經過博主同意orz)
總結
以上是生活随笔為你收集整理的SPOJ 1812 LCS2 - Longest Common Substring II (后缀自动机、状压DP)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Codeforces 947E Perp
- 下一篇: SPOJ 1812 LCS2 - Lon