博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
AC自己主动机 总结
阅读量:6990 次
发布时间:2019-06-27

本文共 2276 字,大约阅读时间需要 7 分钟。

模板--参考六如家培训指南

/*===============================*\依照训练指南写的\*===============================*/#include
#include
#include
#include
#include
using namespace std;const int SIGMA_SIZE = 26;const int MAXNODE = 11000;const int MAXS = 150 + 10;map
ms;struct AhoCorasickAutomata { int ch[MAXNODE][SIGMA_SIZE]; int f[MAXNODE]; // fail函数 int val[MAXNODE]; // 每一个字符串的结尾结点都有一个非0的val int last[MAXNODE]; // 输出链表的下一个结点 int cnt[MAXS]; int sz; void init() { sz = 1; memset(ch[0], 0, sizeof(ch[0])); memset(cnt, 0, sizeof(cnt)); ms.clear(); } inline void clear(){memset(cnt,0,sizeof(cnt));}//假设text不仅仅是一个的话,常常须要每次find都清空一次cnt数组 // 字符c的编号 inline int idx(char c) { return c-'a'; //这里一定小心,假设没有给定字符范围的话。直接return c; //由于可能出现负的...病毒侵袭那题就是 } // 插入字符串。

v必须非0 void insert(char *s, int v) { int u = 0, n = strlen(s); for(int i = 0; i < n; i++) { int c = idx(s[i]); if(!ch[u][c]) { memset(ch[sz], 0, sizeof(ch[sz])); val[sz] = 0; ch[u][c] = sz++; } u = ch[u][c];//u是下一个节点所存储的ch第一维的位置,相当于我trie中的nxt } val[u] = v; //v是附加信息,最好区分开每一个单词这样 //cnt能够记录出现了哪些以及出现了几次 ms[string(s)] = v; } // 递归打印以结点j结尾的全部字符串 void print(int j) { if(j) { cnt[val[j]]++;//val[j]为单词的编号。ms存储了编号和单词的相应,能够用于打印单词 print(last[j]); } } // 在T中找模板 int find(char* T) { int n = strlen(T); int j = 0; // 当前结点编号,初始为根结点 for(int i = 0; i < n; i++) { // 文本串当前指针 int c = idx(T[i]); while(j && !ch[j][c]) j = f[j]; // 顺着细边走,直到能够匹配 j = ch[j][c]; if(val[j]) print(j);//到单词结尾 else if(last[j]) print(last[j]); // 找到了! } } // 计算fail函数 void getFail() { queue<int> q; f[0] = 0; // 初始化队列 for(int c = 0; c < SIGMA_SIZE; c++) { int u = ch[0][c]; if(u) { f[u] = 0; q.push(u); last[u] = 0; } }//由于第一个字符不匹配须要又一次匹配, //所以第一个字符都指向root(root是Trie入口,没有实际含义) //就是说全部单词第一个字符的f[]都等于0。把节点e的fail指针指向root表示没有匹配序列 // 按BFS顺序计算fail while(!q.empty()) { int r = q.front(); q.pop(); for(int c = 0; c < SIGMA_SIZE; c++) { int u = ch[r][c]; if(!u) continue; q.push(u); int v = f[r]; while(v && !ch[v][c]) v = f[v];//ch[v][c]==0的时候,就是说没有继续能够匹配的字母边了。也是没法继续匹配了,所以继续沿失配函数走 f[u] = ch[v][c]; last[u] = val[f[u]] ? f[u] : last[f[u]]; //last[j] 节点j沿着适配指针往回走时,遇到的下一个单词结点编号 //last是为了解决找到一个单词之后,看看有没有其它串包括 } } } }; AhoCorasickAutomata ac;

1、看一个范围内的字符,变化SIGMA_SIZE以及idx功能

版权声明:本文博客原创文章,博客,未经同意,不得转载。

你可能感兴趣的文章
网络工程师成长日记340-某邮政防火墙
查看>>
Java之品优购课程讲义_day02(4)
查看>>
Linux学习-文件管理(1)
查看>>
洞悉物联网发展1000问之什么是物联网基础设施?
查看>>
洞悉物联网发展1000问之智能加到底加什么?
查看>>
错误:26.1.0和27.1.1differ问题
查看>>
2018-05-30笔记(Linux shell基础知识)
查看>>
openStack 瓶颈测试
查看>>
学习java 想成为合格Java软件工程师所要具备哪些专业技能
查看>>
想要提高日常办公效率?这几款软件利器帮助你武装自己!
查看>>
好程序员大数据技术分享:Zookeeper集群管理与选举
查看>>
怎么找到相似Graph?DeepMind提出超越GNN的图匹配网络
查看>>
【2013年总结】思维跌宕起伏,生命颠簸曲折的一年
查看>>
Oracle管理存储架构(一)--概念
查看>>
Centos7系统下Docker ce的安装及镜像加速
查看>>
在老男孩学习的一点想法
查看>>
戴文的Linux内核专题:04安全
查看>>
C# 密封类和密封方法
查看>>
debian 8.4日常问题处理
查看>>
我的友情链接
查看>>