Chinese Traditional Culture
Chu Culture
Introduction to Behavioral Economics
Introduction to Statistics and Applications within Data Science
Healthy China Initiative and International Health Cooperation
Intelligent Robot and Advanced Manufacturing
Smart Earth
Environment and Social Development
Infections and Immune Response
Artificial Intelligence and Big Data
Critical Conservation and Revitalization of Architecture Heritage
《如何通过数据做出决策–数据科学基础》
一、课程基本信息
课程题目 | 如何通过数据做出决策–数据科学基础 |
教授 | Manuel González Canché 宾夕法尼亚大学终身教授 |
先修条件 | 课程开始前无需进行特别准备,建议学生最好先熟悉数据科学分析工具的基本概念 |
教材及工具 | 教材:Wickham, H., & Grolemund, G. (2016). R for data science: import, tidy,transform, visualize, and model data. " O'Reilly Media, Inc."https://r4ds.had.co.nz/index.html Silge, J., & Robinson, D. (2017). Welcome to text mining with R.https://www.tidytextmining.com/Beck, M. W. (2018). NeuralNetTools: Visualization and Analysis Tools for Neural Networks. Journal of Statistical Software, 85(11), 1–20.https://doi.org/10.18637/jss.v085.i11Hvitfeldt, E., & Silge, J. (2022). Supervised machine learningfor text analysis in R. Chapman and Hall/CRC.https://smltar.com/工具:学生将使用R(或Python)统计软件。 |
评分标准 | 课程参与及出勤 60%两次作业 20%期末考试 20% |
课程关键词 | 数据科学、统计建模、数据分析、数据挖掘、数据检索、高级数据可视化 |
二、课程大纲
课节 | 课程名称 | 日期 时间 | |
第一节 | 概述——数据科学的现实意义 | 6/26/2023 | 19:20-20:55 |
第二节 | R语言介绍 | 6/27/2023 | 19:20-20:55 |
第三节 | 数据可视化与数据处理第三章 Wickham & Grolemundhttps://r4ds.had.co.nz/data-visualisation.html | 6/28/2023 | 19:20-20:55 |
第四节 | 特征工程第三章 Wickham & Grolemundhttps://r4ds.had.co.nz/transform.html | 6/29/2023 | 19:20-20:55 |
第五节 | 文本挖掘—自然语言处理第一章 Silge & Robinsonhttps://www.tidytextmining.com/tidytext.html | 7/3/2023 | 19:20-20:55 |
第六节 | 机器学习与无监督学习第六章 Silge & Robinsonhttps://www.tidytextmining.com/topicmodeling. html | 7/4/2023 | 19:20-20:55 |
第七节 | 监督学习第七章 Hvitfeldt & Silgehttps://smltar.com/mlclassification.html#classfir stattemptlookatdata | 7/5/2023 | 19:20-20:55 |
第八节 | 深度学习神经网络Beck 2018https://www.jstatsoft.org/article/view/v085i11 | 7/6/2023 | 19:20-20:55 |
三、课程概述
作为一门高度应用型课程,本课程将为大家简要介绍统计学与数据科学应用的基本概念。通过对每个主题的深入讨论,学生们将在充分理解这些主题的基础上进一步学习如何在R语言中进行分析。所有的数据和代码都将提供给参与本次课程的学生们,我们也会在课堂讨论中聚焦数据科学家与相关学者们所采用的最佳实践。
四、教学目标
1. 本课程将涵盖使用数据科学和可视化进行统计建模的详细介绍和示例;
2. 本课程将为学生提供培养科研技能的机会,包括收集、分析和探索数据的不同方法;
3. 本课程将让学生将他们的学习和知识应用到实践和应用中。