Algorithms: 回文树

我们希望能够快速找到回文子串，回顾 Manacher 算法的思路，我们发现 Manacher 的基本思路就是从 $S_1,S_2,\dots,S_{i-1}$ 递推到 $S_i$ . 但是相比 Manacher 只能按回文中心查找回文串，我们能否按末尾字符来查找回文串呢？

那么假设 $S_{1\sim i-1}$ 的答案已经计算好了，我们该如何为 $S_i$ 计算答案（即找出以 $S_i$ 为结尾的回文串）呢？

Key Observations

如果 $S_i$ 可以产生新的回文子串，那么一定会包含 $S_{1\sim i-1}$ 的后缀

例如，在 fabcb 后面插入 a，是与 fabcb 的后缀 abcb 一起构成回文子串

因为需要产生的子串也得是回文的，所以，找到的那个后缀也应该有一个相同的字符来和 $S_i$ 匹配

例如，在 fabcb 后面插入 a，fabcb 的后缀 abcb 中的 a 就是 $S_i$ 对应匹配的相同字符

在这两个相同字母之间，应该也是回文串。

这个很好理解，回文串去掉头尾各一个字符，中间部分肯定也是回文的

这启发我们以另一个视角来看待回文串：回文串 $P'$ 是回文串 $P$ 的首尾各添加一个字符 $X$ 得到的！即 $P'=X+P+X$ . 这也很符合我们想要递推的做法：令 $P$ 是某个以 $S_{i-1}$ 为结尾的回文串，令 $X=S_i$ ，那么 $P'=S_i+P+S_i$ 就是以 $S_i$ 字符为结尾的最长回文串了。

但注意，这里仍然只是最长回文串，如果我们想求出次长、次次长呢？一样的，我们只需要改变 $P$ 就可以，让 $P$ 长度变得更短，但仍然满足是以 $S_{i-1}$ 作结的回文串。

代码实现

接下来我们用数据结构实现我们的 PAM.

根据我们先前的分析，我们的数据结构需要能够表示：

回文串添加字符得到另一个回文串

这个可以利用添加有向边的方式完成，例如 $P\underset{X}{\to} P'$ 就表示在 $P$ 的前后加上 $X$ 字符就可以得到 $P'$

既然如此，那我们便不能令节点 $node_i$ 表示结束位置在 $i$ 的回文串了，毕竟有可能

回文树的构建

回文树依赖若干个数据结构

树上的每一个节点实际上代表了一个以 $i$ 为结尾的最长回文串（从根到 $s[i]$ ）
对于树上的实边 next[] 指针，next[i]["c"] = j 说明在以 $i$ 为结尾的最长回文串的两边各添加字符 "c"（其实也就是 $s[j]$ ）之后，就变成了以 $j$ 为结尾的最长回文串。
对于树上的虚边 fail[] 指针，它实际上维护的是以 $i$ 为结尾的次长回文串。如果 fail[i] = j，则次长的回文串是 node[j]，其中 node[j] 表示树上节点 $j$ 代表的最长回文串
- 没错，也就是说此时以 $i$ 为结尾的次长回文串和以 $j$ 为结尾的最长回文串是一样的。但是我们又必须以 $i$ 为结尾，所以我们只需要知道其长度信息即可。

要注意的是，节点建模的是“回文串”而不是“以 $i$ 为结尾的最长回文串”，因为以 $i$ 为结尾可能有很多回文串，我们就是要通过 fail 指针快速查找以 $i$ 为结尾的回文串的长度，所以回文串以 $i$ 结尾还是 $j$ 结尾（对于长度这个信息而言）无关紧要。

我们先来定义数据结构

using indexing  = int;
constexpr int N = 5e5 + 5;
constexpr int E = 26;
struct Node {
    std::array<indexing, E> next; // 实边
    indexing fail{0}; // 虚边 fail 指针

    int len{0}; // 这个节点对应的回文串 的长度
    int num{0}; // 多少回文串以 节点i代表的最长回文串最末尾的字符 为结尾
    int count{0}; // 这个节点对应的回文串 的数量
    void init(int len) {
        this->len   = len;
        this->count = 0;
        fail        = 0;
        next.fill(0);
    }
};
std::array<Node, N> T;
std::array<int, N> S;
indexing last = 0, pnode = -1, strend = -1;

// 构造一个新节点，放在末尾
indexing construct(int len) {
    T.at(++pnode).init(len);
    return pnode;
}

// 初始化，添加偶根和奇根节点
// 在最开头插入一个不可能出现的字符，减少后面的特判
void init() {
    // 0: 偶根，1: 奇根
    construct(0), construct(-1);
    T[0].fail = 1;
    S[++strend] = -1;
    last = 0;
}

跳 `fail` 指针

然后我们先来看如何跳 fail 指针。跳 fail 指针的核心在于，对于当前字符 $S[i]$ 找到一个位置 $j$ 使得 $S[i]=S[j]$ 。

如果指针当前指向的 $v$ 、其代表的回文串为 $p(v)$ ，则 $j=i-p(v).\texttt{len}-1$ 。如果无法匹配，我们就跳 fail 指针 $j\gets j.\texttt{fail}$ ，即我在满足 $S[j\dots i-1]$ 是回文串的条件下缩小这个后缀回文串的长度，然后判断 $i$ 能组成的后缀回文串的最大长度。

// 返回 pos 使得
// T[pos].len 最大，且 S[strend - T[pos].len - 1] ~ S[strend] 构成回文串
indexing match(indexing pos) {
    while (S[strend] != S[strend - T[pos].len - 1]) 
        pos = T[pos].fail;
    return pos;
}

在字符串末尾插入字符

然后我们执行插入字符操作。我们需要做两件事：

维护 next[] 指针（实边）
维护 fail 指针（虚边）

对于实边而言，我们找到一个第一个 pos 使得 S[i-T[pos].len-1] ~ S[i] 构成回文串，那么根据定义， $i$ 应该成为 pos 的儿子节点，边权为 S[i].

对于虚边而言，我们需要找到下一个 $j$ 使得

j \ne pos \\ S[j\dots i] \text{ is palindrome.}

既然 $S[j\dots i]$ 是回文串，那么 $S[j+1\dots i-1]$ 也应该是回文串，且 $S[j]=S[i]$ 。这不就是要找 $S[i-1]$ 为结尾的回文串嘛！不过由于是 fail 指针，所以这里的“回文串”其实不是指最长回文串，也就是说，我们需要从 pos.fail 开始跳 fail 指针，以免用最长回文串来更新 fail.

void insert(int c) {
    S[++strend] = c;
    indexing fa = match(last);
    indexing son = T[fa].next[c];
    if (!son) {
        son = construct(T[fa].len + 2);
        T[son].fail = T[match(T[fa].fail)].next[c];
        T[fa].next[c] = son;
        T[son].num = T[T[son].fail].num + 1;
        // 注意这里必须先维护 fail 再更新子节点
        // 不然可能出现当 fa 为偶根和奇根的时候 T[son].fail = son
    }
    last = son;
    T[son].count++;
}

在字符串的开头插入字符

在末尾插入比较好理解，考虑当前在维护第 $i$ 个字符，last 刚好可以代表以 $S[i-1]$ 为结尾的最长回文串。那如果需要在字符串开头插入字符呢？

类似的，我们想，是不是需要用 last_front 表示以 $S[0]$ 为开头的最长回文串，然后跳 fail 呢？但是我们的节点维护的都是以某个字符为结尾的回文串，应该怎么转化呢？

这里，我们就需要以“节点对应的是回文串”视角来看待 last 和 last_front 指针了（而非“节点对应的是以 $i-1$ 为结尾的回文串”）。last_front 指针保存的回文串，是从 S.front() 为开头的最长回文串。

last_front 指针

我们考虑对 last_front 跳 fail 指针，得到的是什么。根据跳 fail 指针的定义，我们会有

last_front 的跳 fail

考虑 last_front 对应回文串的回文性，于是：

利用回文性和 fail 指针的长度信息

于是我们就可以使用和“在末尾插入字符”同样的思路，维护“在开头插入字符”的操作。

线性时间复杂度证明

证明线性复杂度，我们考虑节点在 fail 树上的深度。

回文树