数据挖掘算法讨论课  081202M06001H

学期:2020—2021学年(春)第二学期 | 课程属性:专业研讨课 | 任课教师:刘莹
授课时间: 星期一,第1、2 节
授课地点: 教一楼114
授课周次: 1、2、3、4、5、6、7、8、9、10、11、12
课程编号: 081202M06001H 课时: 20 学分: 1.00
课程属性: 专业研讨课 主讲教师:刘莹 助教:刘慧
英文名称: Data Mining Algorithm Seminar 召集人:

教学目的、要求

本课程在强调对先进理论学习的同时,还注重理论与实践相结合,使计算机专业研究生深入掌握数据挖掘的科研动向,最新技术,培养研究生的学习能力,开阔眼界,为将来的发展打好基础。

预修课程

数据挖掘或人工智能

教 材

主要内容

Topic 1: 并行计算基础 (Principles of parallel computing) 
并行式和分布式计算技术的必要性和重要性,并行计算环境,并行计算的基本方法,并行计算编程 
Topic 2: 分布式计算环境 (Distributed computing) 
分布式计算的体系结构、特点,与并行式数据挖掘的相同点、不同点 
Topic 3: 高性能数据挖掘技术(High performance data mining techniques) 
并行数据挖掘技术的优越性,重要性,SPRINT, 基于SMP的决策树分类,并行K-means,并行关联规则CCPD, CountDist,并行相随模式GSP等 
Topic 4: 深度学习(Deep learning) 
各种基于深度学习网络的检测和分类模型,包括AlexNet,ResNet, VGG, GoogleNet,R-CNN,fast-RCNN, faster-RCNN, Yolo, SSD等
Topic 5: 文本挖掘(Text mining) 
文本挖掘与信息检索(information retrieval)的区别,数据结构特性,measures for text retrieval,基于关键字的关联分析,文本分类,摘要提取,LSTM神经网络等
Topic 6: 社交网络挖掘(Social Network) 
图挖掘(graph mining),社区发现,推荐等

参考文献

research papers