点击上方“智能与算法之路”,选择“星标”公众号
资源干货,第一时间送达
一、资源介绍
今天给大家分享一份微软研究院的新版书籍《Foundations of Data Science》(《数据科学基础》),这本书详细介绍了许多重要的数据科学理论基础。这些理论基础例如奇异值分解(SVD)、马尔科夫链、随机游走等是支撑现在广泛使用在数据应用中的算法的支柱,如推荐系统、语音识别、图神经网络等。
数据科学主要以统计学、机器学习、数据可视化以及(某一)领域知识为理论基础,其主要研究内容包括数据科学基础理论、数据预处理、数据计算和数据管理。
数据科学是一个跨学科的领域,包含所有与结构化和非结构化数据相关的内容,从准备、清理、分析和源于有用的视角开始。它结合了数学、统计学、智能数据捕获、编程、问题解决、数据清理、不同的观察角度、准备和数据对齐。
二、主要内容
数据科学是对数据进行处理的几种技术和流程的组合,以获得有价值的业务视角。通过使用科学的方法、算法、流程和系统来有效地提取信息,这些信息可以被业务用来做出关键的业务决策。
下面是一些主要目录:
  1. 简介
  2. 高维空间
  3. 最佳拟合子空间和奇异值分解(SVD)
  4. 随机游走和马尔科夫链
  5. 机器学习
  6. 面向海量数据问题的算法:流式、概述和采样
  7. 聚类
  8. 随机图
  9. 主题模型、非负矩阵分解、隐马尔科夫模型和图模型
  10. 其他主题
  11. 小波

三、资源分享
同时为了方便大家,我们把最新的资料打包好了,可以直接下载!
获取方式:
1. 关注我们的公众号“智能与算法之路”
2. 后台回复“微软数据科学基础” 即可以获取资料哈~(建议复制,避免错字)
欢迎关注我们,收获资源干货
继续阅读
阅读原文