模式串匹配与信息过滤  0839X2M06001H

学期:2020—2021学年(春)第二学期 | 课程属性:专业研讨课 | 任课教师:刘燕兵
授课时间: 星期四,第5、6、7 节
授课地点: 教一楼219
授课周次: 1、2、3、4、5、6、7
课程编号: 0839X2M06001H 课时: 20 学分: 1.00
课程属性: 专业研讨课 主讲教师:刘燕兵 助教:
英文名称: Pattern Matching and Information Filtering 召集人:

教学目的、要求

本课程是为网络空间安全、计算机等相关专业研究生开设的专业研讨课,其目的是使学生初步掌握模式串匹配与内容分析算法的基本原理和方法,并了解其在智能信息处理、信息内容安全等领域的应用。本课程将系统地介绍模式串匹配与内容分析算法的基本原理、分类方法和经典算法,以及本领域最新的研究进展和工业界发展动态,同时从应用的角度介绍相关算法的实现和优化技术。对学生的要求包括:熟练掌握相关的基本概念、原理和分类,以及经典算法的设计思路与方法,通过研讨了解该技术在智能信息处理、信息内容安全等领域的应用。培养研究生的研究性学习能力,为将来的研究与应用打好基础。

预修课程

数据结构与算法设计、编译原理、计算机体系结构

教 材

《Flexible Pattern Matching in Strings: Practical on-line search algorithms for texts and biological sequences》、《Compact Data Structures: A Practical Approach》、《编译器:原理,技术和工具》、《自动机理论导论》等

主要内容

第1章:概述(2学时,课堂讲授)
1.1模式串匹配与内容分析的基本概念
1.2模式串匹配与内容分析的研究意义、技术现状与挑战
1.3课程内容安排
第2章:精确串匹配技术(3学时,其中课堂讲授1学时,研讨2学时)
2.1基于自动机的串匹配算法
2.2基于哈希的串匹配算法
2.3基于位并行的串匹配算法
第3章:正则表达式匹配技术(3学时,研讨)
3.1正则表达式匹配相关定义与基本理论
3.2基于软件的正则表达式匹配技术
3.3基于硬件的正则表达式匹配技术
第4章:压缩文本索引技术(3学时,其中课堂讲授1学时,研讨2学时)
4.1数据压缩与文本索引概述
4.2 Burrows-Wheeler变换及其应用
4.3 压缩文本索引算法
第5章:字符串相似性搜索技术(3学时,研讨)
5.1字符串相似性搜索的定义与分类
5.2 基于树的字符串相似性搜索算法
5.3基于过滤与验证的字符串相似性搜索算法
第6章:网络数据包分类技术(3学时,其中课堂讲授1学时,研讨2学时)
6.1网络数据包分类的基本定义
6.2网络数据包分类的经典算法
第7章:网络流统计与概要技术(3学时,其中课堂讲授1学时,研讨2学时)
7.1流统计中的近似计数算法
7.2流统计中的可逆概要算法
授课团队学时分配:
由课程首席分配授课团队的课时。
授课团队(列出姓名)	讲授章节	总学时
刘燕兵	1章-7章	20
考核方式:
读书报告与编程实践,平时成绩占50%,期末成绩占50%。

参考文献

SIGCOMM、INFOCOM、SIGMOD、CPM、SPIRE等重要会议和期刊的论文集等