原文:
www.kdnuggets.com/2018/11/data-science-paint-by-numbers-hypothesis-development-canvas.html
当我还是个孩子的时候,我喜欢“按数字上色”的套件。任何能够在画线之间上色的人都可以成为伦勃朗或达芬奇(我们可以稍后讨论强迫孩子们“保持在界线内”的长期影响)。
1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。
2. 谷歌数据分析专业证书 - 提升你的数据分析能力
3. 谷歌 IT 支持专业证书 - 支持你的组织在 IT 领域
设计领域正在使用设计画布应用“按数字上色”的概念。设计画布概述了在特定主题下的重要内容,然后允许“画家”填入正确的信息。设计画布是一个单页操作模板,旨在捕捉成功执行所需的所有不同视角,具体取决于要解决的问题。一个很好的画布示例是 商业模式画布,感谢 Strategyzer(见图 1)。
图 1: 商业模式画布,感谢 Strategyzer
商业模式画布迫使组织“填入”你业务的价值主张、成本结构、收入来源、供应商网络和客户细分。转眼间,每个人都可以成为杰克·韦尔奇!
现在,你已经准备好从大数据 MBA 的角度迈出下一步,通过基于商业模式画布来完善业务用例——或假设——这正是我们可以更有效地利用数据和分析来优化业务的地方。下一步涉及新创建的假设开发画布。
大多数数据科学项目中投资不足的一个领域是对假设或用例的彻底和全面的发展;也就是说,我们试图通过数据科学工作证明什么,以及我们如何衡量进展和成功。
为了满足这些要求,我们开发了假设开发画布——一个“按数字绘画”的模板,我们将在执行数据科学工作之前填充,以确保我们彻底理解我们要实现的目标、业务价值、我们如何衡量进展和成功、与假设相关的障碍和潜在风险。假设开发画布旨在促进业务利益相关者与数据科学的合作(见图 2)。
图 2:假设开发画布
假设开发画布包括以下内容:
-
假设的描述和目标——组织试图预测的内容及其相关目标(例如,减少计划外的操作停机时间 X%,提高客户保留率 X%,减少过时和过剩的库存 X%,提高准时交付率 X%)。
-
从财务、客户和运营角度来看假设的商业价值;即成功解决假设后的粗略投资回报率(ROI)。
-
衡量成功和进展的 KPI,以及与 KPI 潜在的二级和三级影响相关的风险探索。有关 KPI 的二级和三级影响的更多细节,请参见博客“错误衡量的意外后果”。
-
决策——需要做什么、何时、何地、由谁等——以支持和推动行动和自动化,支持假设的业务、客户和运营目标。
-
需要探索的潜在数据来源,包括简要描述及业务利益相关者认为可能是合适数据来源的原因。
-
与假阳性和假阴性(I 型和 II 型错误)相关的风险;与分析模型错误的情景相关的风险。
视觉工作坊加速了业务利益相关者和数据科学团队之间的合作,以确定支撑数据科学工作成功的假设需求。
现在为了完成整个循环,我介绍机器学习画布。我在网站“机器学习画布”上偶然发现了 Louis Dorard 的机器学习画布 v0.4。Louis 已将他的画布免费提供,我也将根据我们的独特数据科学需求,对他的画布进行相应的添加(见图 3)。
图 3:机器学习画布(大数据 MBA 版本)
为了我们的数据科学工作,我们需要在面板中添加内容:
-
处方:一旦我们有了预测,我们该如何处理这个预测?
-
自动化:我们如何利用规范性洞察来自动化标准程序?
成功的数据科学参与需要在整个开发过程中与业务利益相关者密切合作,以:
-
理解和量化金融、运营和客户价值创造的来源(这涉及经济学)。
-
彻底了解将要衡量进展和成功的 KPI 和指标,特别是这些 KPI 和指标的潜在的二次和三次影响。
-
头脑风暴可能会产生更好业务和运营绩效预测的变量和指标(数据来源)。
-
对假设相关的奖励/收益和成本/风险进行编码(包括与假阳性和假阴性相关的风险和成本)。
-
与业务利益相关者密切合作,以了解从预测分析的角度“足够好”实际上是什么时候的“足够好”。
我们现在拥有三个设计画布,不仅可以将我们的商业模型与数据科学和机器学习工作关联起来,而且数据科学团队现在可以直接“看到”他们的工作如何影响商业模型。
图 4:将商业模型与数据科学和机器学习关联起来
引用著名的美国哲学家兼兼职场地管理员卡尔·斯帕克勒的话:“现在我有了这些,这很好。”
相关:
-
打造数据科学团队的制胜计划
-
使用混淆矩阵量化错误成本
-
创建智能的 3 个阶段