今日份知识你摄入了么?
大家经常把机器学习
(ML)
和深度学习
(DL)
混淆,因为这两者都属于数据科学的范畴。虽然机器学习和深度学习存在相似之处,但它们之间也存在主要的区别。

本文将简要解释这些区别,并为每一个分支提供三个示例。

1.
数据集,数据集,数据集
机器学习和深度学习之间的第一个主要区别在于他们所分析的数据类型。机器学习的数据集比深度学习数据集大得多。

图源:Unsplash 摄影:thisisengineering
机器学习数据集通常是结构化数据,这意味着,该数据集具有与数据点相关的标签或类别。例如,该数据集与住房数据相关,包括基于以下 4 个属性的波士顿(Boston)房屋信息:
价格 |平方英尺 |卧室 |浴室
3087000 | 2569 | 4 | 2
2674160 |2388|5 | 3
27200000 | 2875 | 7.5+ | 5.5+
机器学习的数据集规模很大,但结构紧凑,非常适合数据科学家使用。
深度学习
(Deep Learning)

深度学习数据集通常是没有相关标签的图像、音频文件、或视频文件。这类数据集的一个例子是狗和其他动物的照片:
狗 |猫 |马|蛇
深度学习数据集规模很大,但无结构化。

机器学习数据集比深度学习数据集大,因为标记数据非常昂贵。例如,如果数据科学家要为狗狗建立一个图像识别数据集,他们需要雇佣员工,阅读与每张照片相关的标签,纠正不准确的数据。
2.
学习(Learning)与推理(Inference)
机器学习
(ML)

机器学习数据集以人脑为模型,无需编程,即可进行自主学习。

在培训期间,数据科学家需要导入机器学习数据集中的不同数据模式。例如,一张图像包含一只狗。这些数据科学家会通过提供有关如何对数据点进行分类的反馈,从而实现上述操作。
一旦数据科学家导入了不同数据集模式,数据集就能够在没有任何人工干预的情况下自主学习。

深度学习(DL)

深度学习数据集以大脑为模型,通过神经网络进行预测或制定决策。

然而,与机器学习数据集不同,深度学习数据集需要使用标签来训练数据集。在训练期间,数据科学家会标记数据集中的数据点,指导数据集应该如何对数据点进行分类。一旦数据科学家标记了数据集,他们只需要为深度学习数据集提供输入数据。
深度学习数据集将根据训练期间使用的不同算法,自行做出预测或制定决策。
3.
无监督学习(Unsupervised Learning)
与监督学习(Supervised Learning)
机器学习和深度学习数据集之间的第三个主要区别是,数据科学家使用监督学习构建机器学习数据集,而数据科学家使用无监督学习构建深度学习数据集。

监督学习数据集是具有标签的数据集。这些标签需要数据科学家进行额外操作,提高了处理真实数据集的难度,因为数据集需要“做好准备”。数据可能需要聚合或标准化,也可能需要被标记。
无监督数据集对其数据点没有任何先备知识。数据科学家发现数据点时,他们会根据需要来标记数据。这些数据点可用于预测未来的数据集。
无监督数据集不能制定决策,但可以提供有关数据的重要信息,例如数据如何工作,以及数据集中存在哪些模式。
结论
机器学习和深度学习都是帮助数据科学家做出预测或制定决策的数据科学方法。两者的区别在于数据分析方法。一种依赖于算法,而另一种则使用以人脑为模型的神经网络。

使用机器学习的数据科学家需要为为监督式机器学习任务标记充分的数据集,而深度学习不需要在对其进行分析之前标记数据集信息。
希望这篇文章为你解释了机器学习和深度学习的区别。你有什么想法和见解?欢迎在文章下方留言。感谢你的阅读!
原文作者:Christopher Zita
翻译作者:Lia
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://christopherzita.medium.com/machine-learning-vs-deep-learning-whats-the-difference-a1ac0102c982
本周公开课预告
往期精彩回顾
点「在看」的人都变好看了哦
点击“阅读原文”查看数据应用学院核心课程
继续阅读
阅读原文