商业数据分析  120100MGX051H

学期:2020—2021学年(春)第二学期 | 课程属性:公共选修课 | 任课教师:刘颖
授课时间: 星期三,第9、10、11 节
授课地点: 教二楼127
授课周次: 1、2、3、4、5、6、7、8、9、10
授课时间: 星期三,第9、10、11 节
授课地点: 教二楼127
授课周次: 11
课程编号: 120100MGX051H 课时: 30 学分: 1.00
课程属性: 公共选修课 主讲教师:刘颖 助教:
英文名称: Business Data Analysis 召集人:

教学目的、要求

网络与信息技术发展催生了数据资源的繁荣,大数据给社会经济等诸多学科开辟了新的研究视野,数据科学成为继经验科学、理论科学、计算科学之后的一种新研究范式,为经济学、金融学、管理学等领域提供基础的理论和方法。本课程从商业和管理中的实际问题出发,让学生掌握基本的数据分析方法,包括:数据勘探与获取、数据清洗与整合、数据管理与抽样、数据分析与实验、数据解释与应用等,结合经济管理领域的经典问题和大数据下的交叉前沿研究成果,引导学生探索数据分析在各自研究领域的创新和应用,为他们以后的工作、科研拓展思路和视野,并打下良好的基础。

预修课程

教 材

以教师的课件为主,下列教材和图书仅供参考。
Foster Provost, Tom Fawcett. Data Science for Business: What you need to know about data mining and data-analytic thinking. O’Reilly Media; 1 edition (August 16, 2013)
朱扬勇,熊赟著,《数据学》,复旦大学出版社,2009.

主要内容

1、绪论(2学时)
数据资源的国家战略地位、带来的产业变革与商业价值、开辟了新的科学研究领域。国内外现有数据资源的介绍与分类。数据分析的发展历史、与其他学科的关系。网络数据与经济管理交叉领域的前沿研究问题。
2、数据分析的研究范式(3学时)
科学研究范式的演化:经验科学、理论科学、计算科学、数据科学。四种研究范式之间的联系与区别。数据分析的研究框架与关键步骤:数据勘探与获取、数据清洗与整合、数据管理与抽样、数据分析与实验、数据解释与应用等。
3、关联关系研究(3学时)
变量之间关联关系、因果关系研究的常用方法与试用条件。数据分析拓展了关联关系的研究视野。在营销领域,商品的关联销售分析、个性化推荐是研究热点,本章将结合电商网站交易数据,分析商品关联销售规律及推荐算法。在行为金融领域,网络数据能够反映投资者的集群行为,本章将梳理国内外核心期刊的前沿研究成果,分析投资者行为与市场表现之间的关联机理。作业:网络购物商品的关联销售分析;投资者注意力与股票市场表现的关系研究。
4、消费者行为研究(3学时)
消费者行为研究是企业运营、营销、客户关系管理的重要依据。本章介绍行为研究的主要问题及分类,讲解应用数据分析方法展开行为研究的一般框架与步骤。结合国际顶级期刊论文,讲授行为数据的勘探与获取、数据清洗、数据分析与应用的研究范式。作业:网络购物的消费行为分析。
5、社会网络分析(3学时)
社会网络分析在组织行为、市场营销、信息扩散传播等领域有非常广泛地应用。本章介绍社会网络分析的发展历史、社会网络数据的分类和获取、社会网络的表示方法、社会网络数据的分析方法以及商业应用。作业:微博活动的社会网络分析与核心节点挖掘。
6、测度与评价研究(3学时)
网络数据的及时性与普遍性为一些典型综合指标提供了新的测度与评价方法。这些指标包括:公众注意力、投资者情绪、居民消费者信心、通货膨胀预期、小微企业景气等。本章首先梳理传统指标度量和评价研究的常用方法,然后结合网络搜索数据、微博数据、新闻和论坛数据等数据资源,讲授网络数据的获取、清洗、测度与评价方法及应用等方面的研究内容。作业:核心文献精读与研究评述。
7、预测研究(3学时)
现有预测研究的梳理和总结、预测方法的适用性分析。大数据环境下预测研究的新进展,相关专题包括:旅游市场预测、航空客流预测、汽车销售量预测、股票市场预测、失业率和CPI预测。探索针对不同的研究对象,如何应用网络数据与传统数据构建混合预测模型,总结线性模型、智能模型、时变模型、混频模型、高维模型的适用条件。作业:北京园博会客流量的混合预测模型研究。
教 材

参考文献

吕本富,刘颖,《飞轮效应:数据驱动的企业》,电子工业出版社,2015
Tony Hey、Stewart Tansley、Kristin Tolle,潘教峰,张晓林等译. 《第四范式:数据密集型科学发现》,科学出版社,2012.

撰 写 人(楷体小四加粗):刘颖