avatar

算法-字符哈希表

字符串前缀哈希法

给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2l1,r1,l2,r2,请你判断[l1,r1l1,r1]和[l2,r2l2,r2]这两个区间所包含的字符串子串是否完全相同。

字符串中只包含大小写英文字母和数字。

输入格式

第一行包含整数n和m,表示字符串长度和询问次数。

第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。

接下来m行,每行包含四个整数l1,r1,l2,r2l1,r1,l2,r2,表示一次询问所涉及的两个区间。

注意,字符串的位置从1开始编号。

输出格式

对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。

每个结果占一行。

数据范围

1≤n,m≤1051≤n,m≤105

输入样例:

8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2

输出样例:

Yes
No
Yes

分析:

  • 将字符看成是P进制数位映射到数组的前缀中
  • 作用:快速匹配指定区间的字符
  • 字符哈希串的意思 其实就是将字符串的前缀转换为数来存值
    由于每位的权值是不一样的 所以每个前缀值都对应着唯一的一种字符串
    所以相减后的值也应该是唯一的 从而利用相减后的值可以判断字符串的区间段是否相等

    题解:

    #include<iostream>
    using namespace std;
    typedef unsigned long long ULL;     //由于前缀值的值会很大 所以应该将数组中的数据定义为ULL型
    const int N=1e5+10;
    const int  P=131;       //P为权重
                          //131为经验值 即P=131或13331时 哈希冲突的可能性最小
    int n,m;
    char str[N];
    ULL h[N];              //h[]存放字符串的前缀值
    ULL p[N];             //p[]存放各个位数的相应权值
    ULL get(int l,int r)
    {
      return h[r]-h[l-1]*p[r-l+1];        //这步其实是将h[l-1]左移
    }                                       //其目的事实上是为了将h[l-1]的高位与h[r]相对齐从而才可以未完成计算
    int main()
    {
      scanf("%d%d%s",&n,&m,str+1);
      p[0]=1;                         //注意这步千万不要忘了 最开始的权值必须赋值为1 否则接下来就会出错
      for(int i=1;i<=n;i++)
      {
          p[i]=p[i-1]*P;              //计算每个位上的相应权值
          h[i]=h[i-1]*P+str[i];       //计算字符串前缀值
                                      //最新加入的数的权值为p的0次 所以直接加上str[i即可
      }
      while(m--)
      {
          int l1,r1,l2,r2;
          scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
          if(get(l1,r1)==get(l2,r2)) puts("Yes");
          else puts("No");
      }
      return 0;
    }
文章作者: wangzun233
文章链接: https://wangzun233.top/2020/04/19/%E7%AE%97%E6%B3%95-%E5%AD%97%E7%AC%A6%E5%93%88%E5%B8%8C%E8%A1%A8/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 WangZun233