字符串哈希


题目

给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2,请你判断[l1,r1]和[l2,r2]这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数n和m,表示字符串长度和询问次数。第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。接下来m行,每行包含四个整数l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从1开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。每个结果占一行。
数据范围
1≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes

分析

这个题看的时候觉得是不是可以用substr函数来做,后来想想觉得没毛病,但是又觉得如果可以的话,那么KMP的字符串匹配不是也可以用substr来代替,那这两个算法就没有用了,后来用substr交了试试,被一个很大很多的数据TLE了,,问了大佬,substr的时间复杂度是O(n)的,所以,字符串哈希还是很值得学习的,,,,

首先要把字符串的每一个前缀都想象成为一个p进制的数,h[1]就是前一个字符的哈希,h[2]就是前两个字符的哈希,h[3]就是前三个字符的哈希。。这样的话最后就可能会非常大,所以要模上一个数Q,p可以选131,也可以选13331,Q一般选成2的64次方,这样冲突比较小,因为字符串哈希是没有办法解决冲突的。。因为要模除于一个2的64次方,所以可以直接用unsigned long long,因为他溢出就相当于取模了。

这样求出的字符串前缀哈希就可以求出任何一个字串(L,R)的哈希值,公式就是h[R]-+1h[L-1]*p^(R-L+1),如果两个字串的哈希值一样的话就认为他们相等

代码

#include<iostream>
#include<cstring>
using namespace std;
typedef unsigned long long ull;
const int N=100009;
const int p=131;
ull pi[N],h[N];

int main()
{
    int n,m;
    string s;
    cin>>n>>m>>s;
    pi[0]=1;
    for(int i=1;i<=n;i++)      pi[i]=pi[i-1]*p;  //预处理一个p的前n项的乘积
    for(int i=1;i<=n;i++)      h[i]=h[i-1]*p+s[i-1];  //处理字符串的每一位
    while(m--)
    {
        int l1,r1,l2,r2;
        cin>>l1>>r1>>l2>>r2;
        if(h[r1]-h[l1-1]*pi[r1-l1+1]==h[r2]-h[l2-1]*pi[r2-l2+1]) cout<<"Yes"<<endl;
        else cout<<"No"<<endl;
    }
    return 0;
}

Author: 眼里有星星
Reprint policy: All articles in this blog are used except for special statements CC BY 4.0 reprint polocy. If reproduced, please indicate source 眼里有星星 !
 Previous
单链表 单链表
题目实现一个单链表,链表初始为空,支持三种操作:(1) 向链表头插入一个数;(2) 删除第k个插入的数后面的数;(3) 在第k个插入的数后插入一个数现在要对该链表进行M次操作,进行完所有操作后,从头到尾输出整个链表。注意:题目中第k个插入的
2020-02-22
Next 
单调栈 单调栈
题目给定一个长度为N的整数数列,输出每个数左边第一个比它小的数,如果不存在则输出-1。 输入格式第一行包含整数N,表示数列长度。第二行包含N个整数,表示整数数列。输出格式共一行,包含N个整数,其中第i个数表示第i个数的左边第一个比它小的数,
2020-02-22
  TOC