原文:
www.kdnuggets.com/2017/05/guerrilla-guide-machine-learning-r.html
当然,有很多教程和概述可以帮助你获取机器学习所需的见解,但其中许多(大多数?)采取的是长期视角:首先建立基础,然后学习基本知识,再学习一些补充理论,然后在实际操作中不要走得太远,退一步,尝试一些示例,独立完成一个项目……这些都是很好的建议,也是学习……几乎任何东西的好方法。
我知道,我知道……还是不好笑。
1. 谷歌网络安全证书 - 快速进入网络安全职业生涯
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你的组织进行 IT 管理
但假设你不是从零开始。或者你是天才。或者你没有耐心去经历所有的步骤。假设你想快速上手,并在压力下迅速学习一切。最好的方法?理想情况下,不是,但我没有立场去评判。我在压力下工作得最好,并能同情那些只想迅速完成任务的急躁者。
让我们明确一点:这绝对不是快速获得卓越的途径。学习机器学习——就像机器学习本身一样——没有免费的午餐。然而,获得一个实际的概览,以测试水域并决定是否进一步学习这个话题,或者你是否已经对这些(或相关)概念有了扎实的理论理解,游击战的方式可能适合你。
鉴于此,这里是一个关于用 R 学习机器学习的简要指南,为快速学习的黑客提供了完整的课程,适合那些没有时间(或耐心)的人。
第一步总是第一步:让我们学习 R。或者,让我们快速学习 R。你需要安装 R 和 R Studio——编程语言和 R 的图形用户界面编程环境。各种关于如何完成这一步的视频存在,具体取决于操作系统。因此,我将留给你自己去找到适合你个人配置的视频。
不过,如果你对一些能帮助完成安装任务的术语感兴趣,可以查看 McMaster 大学的 R 和 RStudio 安装指南:
一旦你安装了 R,你肯定会想知道如何使用它(这就是你在这里的原因,对吧?)。这段由 Brian Palmer 制作的第一个视频是对基本 R 命令的介绍,采用了入门统计的视角。
以下是 Ralf Becker 制作的视频,涵盖了一些非常基础的数据集分析,这为下一部分做好了很好的准备。
接下来,让我们来看看一个介绍性的机器学习概述。虽然这个话题有各种各样的视频——包括我过去使用和/或建议过的许多——我喜欢保持新鲜感,因此我们将使用 Nando de Freitas(录制时来自不列颠哥伦比亚大学)的以下视频。请注意,这完全不是 R 特定的,而是从概念上而非实际操作上涵盖机器学习。
这是来自该领域伟大思想者的机器学习的极佳介绍。顺便说一下,de Freitas 还有许多其他优秀的机器学习视频可以在 YouTube 上找到,如果你正在寻找更多相关材料,值得一看。
尽管接下来的这对视频在标题中包含了“数据分析”一词,但它们实际上进入了机器学习的领域。然而,这些视频进度较慢,并涵盖了大量的 R 中描述性统计,这是提升语言能力的好地方。这些优秀的视频由微软的 Dave Langer 制作。
为了继续我们在 R 中进行的机器学习探索,请查看 Bargava Subramanian 制作的这段视频,标题为“使用 R 进行机器学习:分类方法速成课程”。该视频很好地将前两个部分介绍的理论与 R 中的实际应用结合起来。
我犹豫是否称之为高级机器学习,但在我们迄今为止看到的背景下,我认为这个标签适用。
我们将探讨两个不同的机器学习主题。第一个是文档分类,这段由 Tim D'Auria 制作的视频展示了“如何在不到 25 分钟内使用 R 构建文档分类器”。有趣吧?
最后,Hamed Hasheminia 快速展示了在 R 中实现神经网络的方法:
一个合乎逻辑的下一步可能是更深入地讨论个别算法,以下是一些在这一方向上的额外资源:
-
R 学习路径:从初学者到专家的 7 个步骤
-
使用支持向量回归在 R 中构建回归模型
-
初学者的神经网络指南!
希望这些内容足以激励那些有动力的黑客在几天内开始机器学习的实践。然而,这不是一个完整的课程;理解机器学习的基础统计构建块需要多年时间,而掌握实际技能则需要数百小时的实践。不过,没人说你不能在完善新技能的过程中动手玩一玩,享受一些入门的乐趣。
相关:
-
《与 Python 一起进行机器学习的游击指南》
-
机器学习关键术语解析
-
机器学习的最佳 R 包