c++ - 旋转后按字典顺序最小的字符串

Question

我需要找到给定字符串的旋转次数，使其在所有旋转中按字典顺序最小。

例如：

原来的：ama

第一次轮换：maa

第二次旋转：aam这是字典顺序上最小的旋转，所以答案是 2。

这是我的代码：

string s,tmp;
    char ss[100002];
    scanf("%s",ss);
    s=ss;
    tmp=s;
    int i,len=s.size(),ans=0,t=0;
    for(i=0;i<len;i++)
    {
        string x=s.substr(i,len-i)+s.substr(0,i);
        if(x<tmp)
        {
            tmp=x;
            t=ans;
        }
        ans++;
    }

    cout<<t<<endl;

对于此解决方案，我得到“超出时间限制”。我不明白可以进行哪些优化。如何提高解决方案的速度？

score 2 · Accepted Answer

您可以使用修改后的后缀数组。我的意思是修改，因为你不能停在词尾。

这是我解决的类似问题的代码（SA 是后缀数组）：

//719
//Glass Beads
//Misc;String Matching;Suffix Array;Circular
#include <iostream>
#include <iomanip>
#include <cstring>
#include <string>
#include <cmath>
#define MAX 10050
using namespace std;

int RA[MAX], tempRA[MAX];
int SA[MAX], tempSA[MAX];
int C[MAX];                

void suffix_sort(int n, int k) {
    memset(C, 0, sizeof C);        

    for (int i = 0; i < n; i++)        
        C[RA[(i + k)%n]]++;

    int sum = 0;
    for (int i = 0; i < max(256, n); i++) {                     
        int t = C[i]; 
        C[i] = sum; 
        sum += t;
    }

    for (int i = 0; i < n; i++)        
        tempSA[C[RA[(SA[i] + k)%n]]++] = SA[i];

    memcpy(SA, tempSA, n*sizeof(int));
}

void suffix_array(string &s) {             
    int n = s.size();

    for (int i = 0; i < n; i++) 
        RA[i] = s[i];              

    for (int i = 0; i < n; i++) 
        SA[i] = i;

    for (int k = 1; k < n; k *= 2) {     
        suffix_sort(n, k);
        suffix_sort(n, 0);

        int r = tempRA[SA[0]] = 0;
        for (int i = 1; i < n; i++) {
            int s1 = SA[i], s2 = SA[i-1];
            bool equal = true;
            equal &= RA[s1] == RA[s2];
            equal &= RA[(s1+k)%n] == RA[(s2+k)%n];

            tempRA[SA[i]] = equal ? r : ++r;     
        }

        memcpy(RA, tempRA, n*sizeof(int));
    } 
}

int main() {
    int tt; cin >> tt;
    while(tt--) {
        string s; cin >> s;
        suffix_array(s);
        cout << SA[0]+1 << endl;
   }
}

我主要从这本书中获取了这个实现。有一个更容易编写的 O(n log²n) 版本，但对于您的情况（n=10^5）可能不够高效。这个版本是 O(n log n)，它不是最有效的算法。维基百科文章列出了一些 O(n) 算法，但我发现它们中的大多数都过于复杂，无法在编程竞赛中编写。这个 O(n log n) 通常足以解决大多数问题。

你可以在这里找到一些解释后缀数组概念的幻灯片（来自我提到的书的作者）。

score 1 · Accepted Answer

我知道这来得很晚，但我在搜索该算法的更快变体时偶然从谷歌发现了这一点。结果发现在 github 上有一个很好的实现：https ://gist.github.com/MaskRay/8803371

它使用 lyndon 分解。这意味着它重复地将字符串拆分为按字典顺序递减的 lyndon 单词。Lyndon 词是它们自身的（其中一个）最小旋转的字符串。以循环方式执行此操作会产生字符串的 lms 作为最后找到的 lyndon 单词。

int lyndon_word(const char *a, int n)
{
  int i = 0, j = 1, k;
  while (j < n) {
    // Invariant: i < j and indices in [0,j) \ i cannot be the first optimum
    for (k = 0; k < n && a[(i+k)%n] == a[(j+k)%n]; k++);
    if (a[(i+k)%n] <= a[(j+k)%n]) {
      // if k < n
      //   foreach p in [j,j+k], s_p > s_{p-(j-i)}
      //   => [j,j+k] are all suboptimal
      //   => indices in [0,j+k+1) \ i are suboptimal
      // else
      //   None of [j,j+k] is the first optimum
      j += k+1;
    } else {
      // foreach p in [i,i+k], s_p > s_{p+(j-i)}
      // => [i,i+k] are all suboptimal
      // => [0,j) and [0,i+k+1) are suboptimal
      // if i+k+1 < j
      //   j < j+1 and indices in [0,j+1) \ j are suboptimal
      // else
      //   i+k+1 < i+k+2 and indices in [0,i+k+2) \ (i+k+1) are suboptimal
      i += k+1;
      if (i < j)
        i = j++;
      else
        j = i+1;
    }
  }
  // j >= n => [0,n) \ i cannot be the first optimum
  return i;
}

c++ - 旋转后按字典顺序最小的字符串

2 回答 2

Related

Reference