原文:
www.kdnuggets.com/2022/12/complete-machine-learning-study-roadmap.html
图片来源于作者
机器学习领域比数据科学和数据工程更具针对性,后者自然包含了机器学习。那么你需要做什么才能成为这个领域的一部分呢?
1. Google 网络安全证书 - 快速进入网络安全职业。
2. Google 数据分析专业证书 - 提升你的数据分析能力
3. Google IT 支持专业证书 - 支持你所在组织的 IT
为了让你理解机器学习的概念及其所有内容 - 你需要彻底掌握基础知识。这包括背后的理论、概念、方法和算法 - 了解它们为何如此运作,以及它们如何作为机器学习的基石。这些前提条件涉及分析工作,帮助你在作为机器学习工程师的过程中:
-
标准差
-
线性代数
-
统计学
-
概率
这里有一些资源可以帮助你深入理解:
-
机器学习数学 - 书籍
-
Khan Academy 的线性代数 - YouTube
-
Khan Academy 的统计学与概率 - YouTube
-
机器学习的数学基础 - Udemy
机器学习由以下阶段组成:
在这个阶段,你将从业务角度更好地了解手头的问题或任务。这将帮助你收集正确的数据以输入到模型中。数据的质量和数量将决定你的预测模型能否产生可信的输出。
数据准备需要大量时间,因为数据从来都不是我们需要的格式。这将包括去重、标准化、错误修正以及特征工程等进一步的准备工作。
根据手头的任务,你将选择正确的模型来帮助解决问题。这个路线图过程的下一阶段会涉及到你通常会遇到的不同机器学习算法。
这个阶段是用你收集和准备的数据来测试你的模型。训练数据集将用于提高模型的预测能力。测试数据集是训练数据集的一个子集,提供了对最终模型的无偏评价。
模型优化是一个迭代训练模型的过程,导致最大值和最小值函数评估。进一步的评估包括使用在训练阶段未使用的数据来测试模型,以查看模型在未见过的数据上的表现。
为了使你的模型表现得非常好,你将经历大量的调整。所有这些已调节的组件,从模型到指标,都需要跟踪,以保持项目的有序,并提供对模型历史的便捷访问。
这是机器学习过程的最后阶段。将你的机器学习模型投入生产,以便它可以用于基于数据做出业务决策。
如果你想对机器学习过程有更深入的理解,可以查看这些资源:
-
接近(几乎)任何机器学习问题 - 书籍
-
机器学习的 7 个步骤 - YouTube
-
接近机器学习过程的框架 - 博客
-
部署机器学习模型的意义是什么? - 博客
一旦你对基础数学有了良好的理解,你将能够迅速理解机器学习算法——因为这都是基于数学的。
作为一名机器学习工程师,你将始终使用算法——它们是指示计算机该做什么的指令。因此,你需要理解这些指令。
有 4 种不同类型的机器学习算法:
-
有监督学习
-
无监督学习
-
半监督学习
-
强化学习
你将频繁使用并且非常流行的机器学习算法类型是:
-
线性回归
-
逻辑回归
-
决策树
-
随机森林
-
支持向量机(SVMs)
-
朴素贝叶斯
-
KNN 分类
-
K-Means
-
人工神经网络(ANNs)
-
循环神经网络(RNNs)
阅读这篇文章:每种机器学习算法的解释不到 1 分钟。
如果你想要更深入的解释,可以阅读这个:流行的机器学习算法
这里还有一些其他资源供你查看:
-
Simplilearn 的机器学习算法 - YouTube
-
《理解机器学习:从理论到算法》 作者 Shai Shalev-Shwartz,?Shai Ben-David - 书籍
在这个阶段,了解机器学习算法的基础也很重要。这与手头的任务有关 - 这是分类任务吗?如果是,哪种算法最合适?这是监督学习还是无监督学习?通过这些,你将看到基础知识和机器学习算法之间的联系。
作为一名机器学习工程师,你将花费大量时间来构建算法和应用。因此,你需要了解帮助构建这些的库。机器学习库是一系列创建来帮助开发机器学习应用的函数 - 通过它们的预打包函数。
这里列出了一些最知名和使用的库:
-
Pandas - 管理表格数据
-
NumPy - 科学计算
-
Matplotlib - 数据可视化
-
Scikit-Learn - 数据预处理和建模
-
SciPy - 科学计算
-
NLTK - 文本处理
-
TensorFlow - 深度学习
-
Keras - 深度学习
-
PyTorch - 深度学习
-
HuggingFace - 构建、训练和部署机器学习模型的工具
学习这些库的最佳方式是通过它们的用户指南和文档,上面都已经链接了。
所以你已经掌握了基础知识、机器学习算法和库,下一步是将所有这些知识和技能应用于实际案例。这不仅测试你的技能,还可以展示你在该领域的优点和缺点。它还帮助你丰富你的作品集,这将有助于你进入下一阶段!
我遇到了 Thecleverprogrammer,他有一个不同类型的机器学习项目列表,适合初学者和中级学习者。自己尝试解决挑战,然后反思他是如何处理手头的问题或任务的,这是很好的。
这里列出了一些适合初学者的机器学习项目
- 如果你准备好挑战一些更具难度的项目,可以看看这些:
通过这些项目,你不仅是在测试自己的技能,还在了解自己的优点和帮助定义你的弱点。这些项目不仅在这方面帮助你,还将帮助你建立作品集/简历 - 为面试做好准备!
有很多资源可以帮助你为面试做准备,包括书籍、PDF、在线课程和网络研讨会,你也可以通过与行业内的人交流获取有价值的信息。
以下是一些资源,帮助你为机器学习面试做准备:
-
赢得下一个机器学习面试 - 网络研讨会(免费)
-
机器学习面试准备 - Udacity(免费)
-
机器学习面试问题 + 小抄 - PDF(免费)
-
机器学习面试 - 书籍
-
掌握机器学习面试 - Educative
如果你在寻找一些额外的资源来帮助你在机器学习领域变得更加熟练。
-
15 本免费机器学习和深度学习书籍
-
15 本更多免费机器学习和深度学习书籍
尼莎·阿里亚 是一位数据科学家和自由技术写作者。她特别关注提供数据科学职业建议或教程以及围绕数据科学的理论知识。她还希望探索人工智能在延长人类寿命方面的不同方式。作为一名热衷学习者,她希望扩展自己的技术知识和写作技能,同时帮助指导他人。
-
[KDnuggets 新闻,12 月 14 日:3 个免费的机器学习课程](https://www.kdnuggets.com/2022/n48.html)
-
[KDnuggets 新闻,8 月 31 日:完整的数据科学学习路线图](https://www.kdnuggets.com/2022/n35.html)