原文:
www.kdnuggets.com/2019/12/ultralearn-data-science-deep-understanding-experimentation-part4.html
评论
由 Benedict Neo,数据科学爱好者和博主。
1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你的组织 IT
照片由 Franki Chamaki 拍摄,来自 Unsplash。
另见
-
如何“超学习”数据科学,第一部分,什么是“超学习”,你如何遵循这一策略成为数据科学专家?
这是关于超学习数据科学系列的最后一部分。在这一部分,我将讨论深刻理解和实验。
通过最大化优化学习的技能,现在是时候制定策略来培养深刻的理解,并开放接受会促成创新的实验。
在每个案例中,我将分别使用理查德·费曼和文森特·梵高作为例子。
物理学家理查德·费曼以其非凡的直觉著称;他能够看透复杂的问题,仿佛从空气中找出解决方案。
这种能力的技术术语是直观专业知识,对外界观察者来说可能显得颇为神秘。
但费曼的灵光一现有一个完全合理的解释:他对物理学的深刻理解使他能够直观地发现意想不到的联系和模式。
“我很早就学会了区别知道某物的名称和真正了解某物的不同。”
― 理查德·P·费曼
成为一个有洞察力的数据科学家,需要时间和耐心来建立直观专业知识所依赖的深刻理解。
但通过采用这四种策略,你可以加速获取它的速度。
(1) 把基础搞对
从回归基础开始。费曼以提问“愚蠢问题”而闻名,他会通过不断问关于基本概念的问题来让学生感到沮丧。
然而,费曼知道他的学生还没有学到的东西:当你对基础概念只有模糊理解时,进步到复杂概念是不可能的。
另一方面,直到你彻底了解你领域的基础概念,你是不可能成为直观专家的。
数据科学需要复杂的数学和机器学习。
然而,这并不意味着你必须将每个理论和事实都牢记于心。实际上,有大量的库和包可以让你将数学和机器学习应用到你的项目中。
你只需要对基本概念有一个基本的理解和洞察。所以,确保你掌握了基础概念,你就准备好了!
(2) 选择更长、更艰难的路线
一个具有挑战性的学习经历可以带来对主题的更深刻理解。
所以你应该尝试接受挑战。在学习中抵制捷径;如果有两种方式可以得到解决方案,选择更长、更复杂的一种。
与其使用干净且结构良好的数据进行项目,不如稍微弄脏一点,从互联网获取非结构化数据并开始清理它。
这将为你未来处理各种数据做好准备。在你下一个数据科学项目中,尝试使用原始数据,并自行清理。你会学到很多东西。
(3) 在困难的障碍中坚持不懈
当遇到挑战时,尽量不要立即放弃。相反,实施一个奋斗计时器。强迫自己在寻找简单解决方案之前,先面对每个挑战或障碍至少 10 分钟。
提出正确的问题可能非常困难,因为这需要创造力、分析、很多研究等。基本上,解决问题需要你坐下来,拿起纸笔开始头脑风暴,尽管这有点老派。
与其急于得出结论和匆忙解决问题,不如思考它们并权衡所有相关因素。
(4) 自行复制概念
最后,通过自己复制核心概念来加深理解。查看你领域内专家制定的思想和过程,然后尝试证明或复制它们。
换句话说,你在理解背后的过程和思维模式。这为你提供了了解他们思维的机会,并帮助你获得深刻的知识和直观的专业技能。
要了解一位灵活的数据科学家的思路,你可以阅读他们的文章、作品或博客,这些内容能让你一窥他们的工作流程和过程。
例如,你观看了一段关于如何使用 TensorFlow 进行目标检测的 YouTube 视频。在认真观看后,你重复了整个过程,并将 TensorFlow 应用于你的模型,加入了你自己个性化的功能和使用案例。
文森特·梵高是如何从一个被同学称为“平庸”画家的艺术学校辍学生,成长为绘制了《向日葵》和《星空》等杰作的创新艺术家的呢?
通过持续而不懈的实验。回顾梵高的全部作品,你会发现他并不是一开始就找到他独特的美学风格。
相反,他不懈地尝试不同的风格和技巧,直到掌握了他的技艺。然后,他进行了更多的实验,最终形成了独特的风格。
实验是超学习的秘密武器——这一技巧可以将你从一名成熟的从业者提升为真正的创新者。但刚开始时,实验可能会显得有些令人不知所措。
实验在数据科学中的重要性
“实验旨在识别变量之间的因果关系,这在许多领域中是一个非常重要的概念,对于今天的数据科学家尤其相关。”
在 敏捷数据科学的关键:实验中,它提到:
“数据科学的本质是实验性的。你不知道你所被问到的问题的答案——甚至不知道是否存在答案。你不知道需要多长时间才能得出结果,也不知道需要多少数据。最简单的方法就是想出一个想法并进行尝试,直到得到一些结果。”
在题为 要成为更有效的数据科学家,请以实验为思维方式 的博客中,作者 Aleksey Bilogur 写道:
“数据科学中的基本价值单位是实验。”
数据科学的艺术就是生成良好假设的艺术。
一名“优秀”的数据科学家知道他们可以探索哪些途径,最有可能对模型性能产生实际影响。他们能够提出假设并进行实验,以最高的概率实际提升模型性能。
这种对“正确”做法的“感觉”首先来自经验,其次来自对数据集的理解,第三来自技术专长。
成为一个优秀的“艺术家”意味着成为一个出色的工作者:你在尝试死胡同时花费的时间更少,而在对模型进行有价值的改进时花费的时间更多。
从这些例子中,很明显数据科学的基本概念就是实验。
科学家利用科学方法在多个与假设相关的实验中收集实证证据,以支持或反驳理论。
数据科学家本质上是一个不断用数据进行实验的科学家,直到模型(理论)准确(有效)。
实验的三步骤
- 先复制再创造
如果你不知道从哪里开始,可以使用一种技巧:先复制再创造:模仿别人的工作,然后以此作为测试自己想法的跳板。
“好的艺术家借鉴,伟大的艺术家偷取。” — 巴勃罗·毕加索
- 约束
另一个可以帮助你快速启动实验的方法是对其施加一些约束。
这可能看起来有些反直觉,但限制你的创造力可以促使它绽放。这是因为在严格限制下工作可以帮助你摆脱旧习惯,迫使你尝试新事物。
- 混合
最终,通过混合你的材料、技术或技能来追求意想不到的结果,以发现你的隐藏超能力。将两个看似无关的元素结合起来可以带来伟大的成果。
例如,如果你有天体物理学背景,并且对艺术和音乐充满热情,你可以使用机器学习来可视化黑洞、创建模拟,甚至预测距离数十亿光年的星球和星星的样子。
使用诸如astroML和深度学习这样的工具,前景无限。通过积极的实验和创造力,以及混合你的技能集,你可以创造突破性的工作并实现不可能的目标。
要真正成为一名数据科学家,必须对数据有深刻理解,并勇于尝试不同的模型。这两种特质将确保从数据中提取隐藏洞察的成功,并产生有价值的信息。
你今天应该采取的四个步骤:
-
掌握基础知识。
-
走更长的路,并在困难中坚持。
-
向专家借鉴,然后创造。
-
通过混合不同的工具和技能集进行实验。
原始。经许可转载。
相关: