首页 如何通过数据做出决策-数据科学基础 教学大纲

 

《如何通过数据做出决策数据科学基础》

 

一、课程基本信息

 

 课程题目                                                              如何通过数据做出决策–数据科学基础
  教授 Manuel González Canché 宾夕法尼亚大学终身教授
 先修条件 课程开始前无需进行特别准备,建议学生最好先熟悉数据科学分析工具的基本概念
 教材及工具 教材:Wickham, H., & Grolemund, G. (2016). R for data science: import, tidy,transform,   visualize,   and   model   data.   "   O'Reilly   Media,   Inc."https://r4ds.had.co.nz/index.html Silge, J., & Robinson, D. (2017). Welcome to text mining with R.https://www.tidytextmining.com/Beck, M. W. (2018). NeuralNetTools: Visualization and Analysis Tools  for  Neural  Networks.  Journal  of Statistical  Software, 85(11), 1–20.https://doi.org/10.18637/jss.v085.i11Hvitfeldt, E., & Silge, J. (2022). Supervised machine learningfor text analysis in R. Chapman and Hall/CRC.https://smltar.com/工具:学生将使用R(或Python)统计软件。
 评分标准 课程参与及出勤 60%两次作业 20%期末考试 20%
 课程关键词 数据科学、统计建模、数据分析、数据挖掘、数据检索、高级数据可视化

 

 

二、课程大纲

 

课节 课程名称   日期              时间
第一节 概述——数据科学的现实意义 6/26/2023 19:20-20:55
第二节 R语言介绍 6/27/2023 19:20-20:55
第三节 数据可视化与数据处理第三章 Wickham & Grolemundhttps://r4ds.had.co.nz/data-visualisation.html 6/28/2023 19:20-20:55
第四节 特征工程第三章 Wickham & Grolemundhttps://r4ds.had.co.nz/transform.html 6/29/2023 19:20-20:55
第五节 文本挖掘自然语言处理第一章 Silge & Robinsonhttps://www.tidytextmining.com/tidytext.html 7/3/2023 19:20-20:55
第六节 机器学习与无监督学习第六章 Silge & Robinsonhttps://www.tidytextmining.com/topicmodeling. html  7/4/2023 19:20-20:55
第七节 监督学习第七章 Hvitfeldt & Silgehttps://smltar.com/mlclassification.html#classfir stattemptlookatdata  7/5/2023 19:20-20:55
第八节 深度学习神经网络Beck 2018https://www.jstatsoft.org/article/view/v085i11 7/6/2023 19:20-20:55

 

 

三、课程概述

 

作为一门高度应用型课程,本课程将为大家简要介绍统计学与数据科学应用的基本概念。通过对每个主题的深入讨论,学生们将在充分理解这些主题的基础上进一步学习如何在R语言中进行分析。所有的数据和代码都将提供给参与本次课程的学生们,我们也会在课堂讨论中聚焦数据科学家与相关学者们所采用的最佳实践        

 

四、教学目标

 

1. 本课程将涵盖使用数据科学和可视化进行统计建模的详细介绍和示例;

2. 本课程将为学生提供培养科研技能的机会,包括收集、分析和探索数据的不同方法;

3. 本课程将让学生将他们的学习和知识应用到实践和应用中