信息检索  081104M06010H

学期:2020—2021学年(春)第二学期 | 课程属性:专业研讨课 | 任课教师:刘康
授课时间: 星期二,第3、4 节
授课地点: 教一楼109
授课周次: 6、7、8、9、10、11、12、13、14、15
课程编号: 081104M06010H 课时: 20 学分: 1.00
课程属性: 专业研讨课 主讲教师:刘康 助教:张元哲
英文名称: Public Information Retrieval Seminar 召集人:

教学目的、要求

本课程是为计算机及相关专业研究生开设的专业研讨课,其目的是使学生初步掌握信息检索的基本概念、核心任务和经典方法;并通过研讨信息检索领域的最新研究问题、模型、方法以及其在问答系统等相关任务中的应用,激发学生研究兴趣,培养学生独立思考问题、探究发展方向、解决实际问题的能力。
课程基本要求:本课程是关于信息检索的研讨课程,主要内容侧重于梳理信息检索领域的核心问题、经典方法,探讨最新挑战、方法及在问答系统中的应用,课程内容覆盖面广,且跨越多个研究方向,因此要求学生应具备较好的数学和算法基础,还应掌握机器学习(如统计机器学习和深度学习)的基本概念和方法,熟练掌握信息检索的常用模型和算法,掌握信息检索的主要思路与方法,了解自然语言处理和问答系统的基本概念和常用方法。

预修课程

现代信息检索

教 材

C. Manning, P. Raghavan, and H. Schütze. Introduction to Information Retrieval, Cambridge University Press, 2008

主要内容

课程讲授4学时+主题研讨16学时=20学时。
第1章 信息检索基础(1学时)
1.1 信息检索基本概念
1.2 信息检索基本模块介绍
第2章 信息检索基础模型和方法(1学时)
2.1信息检索基础检索模型
2.2 相关反馈、网页排序、主题模型等
第3章 问答系统(2学时)
3.1 问答系统基础
3.2 检索式问答系统
3.3 社区问答
3.4 阅读理解式问答系统
3.5 面向知识图谱的问答系统
第4章 主题研讨(2学时)
4.1:信息检索模型的难点
4.2:信息检索模型的最新方法
第5章 主题研讨(2学时)
5.1:信息抽取任务和难点
5.2: 信息抽取的相关进展
第6章 主题研讨(2学时)
6.1:主题模型任务和难点
6.2: 主题模型的进展与方法
第7章 主题研讨(2学时)
7.1:词嵌入、话题分析的难点
7.2:基于表示学习的话题分析方法及相关进展
第8章 主题研讨(2学时)
8.1:排序学习的难点
8.2:排序学习的最新方法及相关进展
第9章 主题研讨(2学时)
9.1:社区问答的问题和最新方法
9.2:短文本匹配模型在问答系统中应用
第10章 主题研讨(2学时)
10.1:机器阅读理解的问题、挑战及方法
10.2:开放域问答的问题、挑战及相关进展
第11章 主题研讨(2学时)
11.1:知识图谱的相关进展
11.2:知识库问答的难点、方法及相关进展

参考文献

宗成庆,统计自然语言处理(第2版),清华大学出版社, 2013.8
赵军等,知识图谱,高等教育出版社,2018.11