Python语言及其在生物数据分析中的应用  086000M05002T

学期:2020—2021学年(春)第二学期 | 课程属性:专业普及课 | 任课教师:刘小平
授课时间: 星期一,第9、10、11 节
授课地点: 13号楼113
授课周次: 1、2、3、4、5、7、9、10、11、12、13、14、15
授课时间: 星期二,第9、10、11 节
授课地点: 13号楼113
授课周次: 14
授课时间: 星期二,第9、10、11 节
授课地点: 13号楼115
授课周次: 14
课程编号: 086000M05002T 课时: 41 学分: 2.00
课程属性: 专业普及课 主讲教师:刘小平 助教:
英文名称: Python Language and Its Application in Analysis of Biological Data 召集人:

教学目的、要求

Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。相比其他编程语言(比如 Java),Python 代码非常简单,语法清晰,上手非常容易,而且可扩展性非常强。Python 作为一门解释型的语言,它天生具有跨平台的特征,只要为平台提供了相应的 Python 解释器,Python 就可以在该平台上运行。Python程序设计语言是目前数据分析领域最热门的编程语言,在科学计算、数据分析、工程设计方面都有着广泛的应用。
随着人类基因组计划的开展,大量生物数据被检测,并且随着生物检测手段(Microarray,RNA-Seq,scRNA-Seq等)的提高,单次生物实验能够获得的数据量也在飞速提高,大量的生物数据的积累传统的基于生物统计学的数据处理方式已经不再适用,新的高纬度、大规模数据处理技术已经成为生物和医学实验室的必备条件。
本课程将重点讲授Python程序设计语言规则、高通量生物数据的性质和特点、常用数据处理方法的优缺点、Python语言处理生物数据的基本思路、Python在数据处理过程中常见的问题。旨在帮助从事生物科学研究的人员掌握Python程序设计语言进行生物数据分析任务,是一门需要掌握的基础和工具课程。

预修课程

教 材

主要内容

第一章 绪论(3学时)
1.1 什么是计算机编程语言
1.2 计算机语言发展过程 
1.3 Python语言特点
1.4 Python语言适合做什么 
1.5 Python安装
第二章 Python基本语法(3学时)
2.1	 Python编码规则 
2.2	 变量和常量 
2.3	 运算符和表达式
第三章 数据处理程序编写(3学时)
3.1 编程流程 
3.2 Python程序类型
3.3 从键盘输入信息
3.4 在屏幕上输出信息
第四章 Python流程控制及其应用(3学时)
4.1 条件语句 
4.2 条件语句在数据处理中的作用
4.3 循环语句 
4.4 循环控制在数据处理中的作用
4.5 跳转语句
4.6 跳转控制的作用
第五章 RNA-Seq数据处理简介(3学时)
5.1 RNA-Seq数据特点
5.2 RNA-Seq数据处理技巧
5.3 Python处理RNA-Seq数据实例
第六章 数据处理中的函数与模块(3学时)
6.1 函数 
6.2 模块 
6.3 综合实例 
第七章 字符类型数据的处理(3学时)
7.1 通用序列结果 
7.2 字符串格式化 
7.3 字符串的方法
第八章 生物数据中常用数据结构(一)(3学时)
8.1 序列 
8.2 元组 
8.3 列表 
第八章 生物数据中常用数据结构(二)(3学时)
8.4 字典 
8.5 集合
第九章 数据文件处理(3学时)
9.1 常见文件操作
9.2 常见目录操作
第十章 生物数据的编程练习(3学时)
10.1 RNA-Seq数据处理综合练习
课程论文(2学时)
四、考核方式和成绩评定
开卷考试;平时讨论课成绩(40%)、论文成绩(60%)

参考文献

任何 “Python编程语言”和“生物信息学”的教科书