Skip to content

Latest commit

 

History

History
105 lines (53 loc) · 5.75 KB

first-ml-value-chain-landscape-sequence.md

File metadata and controls

105 lines (53 loc) · 5.75 KB

首个机器学习价值链全景

原文:www.kdnuggets.com/2022/10/first-ml-value-chain-landscape-sequence.html

首个机器学习价值链全景

来源:TheSequence

TheSequence 是一个与 DeepMind、OpenAI、Google Brain 以及更多公司合作的机器学习社区。机器学习和人工智能的世界发展如此迅速,专业人士和有志专业人士很难跟上所有的变化。TheSequence 的目标是让对该领域感兴趣的人无需阅读白皮书和花费大量时间研究,便能更聪明地了解人工智能。

他们还提供其他知识更新,如果你想了解更多,请点击此链接

首个机器学习链全景

2022 年 10 月 12 日,TheSequence 发布了首个机器学习链全景,由数据科学家塑造。这源于 TheSequence 希望创建一个能够涵盖整个机器学习价值链的新全景,这是一个全面但非常有价值的项目。

该项目分为两个部分:

  1. 准备和使用现有研究

  2. 涉及社区成员来评估和重塑价值链

典型机器学习过程的 6 个阶段包括:

  1. 数据收集

  2. 数据处理

  3. 数据标注

  4. 机器学习模型训练和评估

  5. 机器学习模型部署

  6. 模型监控

TheSequence 联合创始人 Ksenia Se 说:

我们都认为机器学习领域有问题,但我们没有完全意识到它的割裂程度。似乎许多机器学习从业者要么面临困难,要么根本无法实现目标。这并不是因为代码差或数据嘈杂,而是因为软件不兼容和链中的策略不佳,而链通常从一开始就形成。”

从下图来看,TheSequence 制作的机器学习价值链全景告诉我们,不幸的是,目前没有一个市场解决方案覆盖链中的所有六个阶段。

涵盖至少 5 个阶段的供应商包括 H2O、Dataiku、Clear ML、Vertex AI、Scale AI、Toloka AI 和 Abacus.AI。

首个机器学习价值链全景

点击放大

该全景揭示了:

大约 50%的数据处理和模型监控是困难的

这通常从生产的早期阶段开始,挑战会持续到后期部署。机器学习项目成功的重要方面还包括数据收集和数据标注的有效性。

开发阶段优化不良

一个根本性挑战是开发阶段的优化不足,这在后续阶段反映得很明显。因此,模型的监控是价值链景观中一个被高度避免的阶段。

数据处理挑战

数据处理从来不是一项简单的任务,它是一个非常分散的领域,伴随着各种挑战。许多人渴望找到一种易于使用、配置和扩展的流程,但迄今为止还没有找到。

自由流动的更好不同阶段

在你做的任何事情中,当一个阶段的效率可以用于下一个阶段时,这当然是很好的。然而,如果不同阶段之间没有互动或兼容性 - 这将导致机器学习项目的完成率低下。市场上有很多软件工具不幸地不兼容,而且技术解决方案越来越复杂,不同背景的专业人士合作的难度也随之增加。

能够覆盖整个价值链

如上图所示,没有供应商能够覆盖整个价值链,尽管有些非常接近。然而,目前没有可灵活适应每个机器学习阶段要求的通用环境。

Ksenia 说:

“我想补充一下,自从发布了这个景观图以来,我们看到社区对此产生了极大的兴趣。机器学习行业发展非常迅速,跟上所有在机器学习价值链不同部分工作的初创公司非常困难。我们计划定期更新这个景观图。”

想了解更多?

如果你想保持对机器学习、人工智能和数据科学世界动态的了解 - 确保点击这个链接订阅 TheSequence。

Nisha Arya 是一名数据科学家和自由职业技术作家。她特别感兴趣于提供数据科学职业建议或教程和理论知识。她还希望探索人工智能如何/可以促进人类寿命的不同方式。她是一个热衷学习者,寻求拓宽她的技术知识和写作技能,同时帮助指导他人。


我们的前三大课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。

2. 谷歌数据分析专业证书 - 提升你的数据分析能力

3. 谷歌 IT 支持专业证书 - 支持你的组织 IT 需求


更多相关主题