Skip to content

Latest commit

 

History

History
241 lines (121 loc) · 10.8 KB

tips-for-successfully-navigating-beginner-data-science-job-interviews.md

File metadata and controls

241 lines (121 loc) · 10.8 KB

成功应对初级数据科学职位面试的技巧

原文:www.kdnuggets.com/tips-for-successfully-navigating-beginner-data-science-job-interviews

成功应对初级数据科学职位面试的技巧

数据科学。它令人兴奋,也令人紧张。


我们的三大课程推荐

1. 谷歌网络安全证书 - 快速入门网络安全职业。

2. 谷歌数据分析专业证书 - 提升你的数据分析能力

3. 谷歌 IT 支持专业证书 - 支持你的组织的 IT


它是跨学科的,并且不断演变。它揭示了数据中的谜团,并要求创新解决方案。这就是数据科学吸引人的原因,更不用说薪资丰厚了。

数据科学有时也令人沮丧,原因有时是相同的。加上激烈的竞争和期望、不断变化的目标和伦理困境。

踏入其中让你既想抓狂,又奇怪地享受其中。有点像跟随技术狂人在 Twitter 上。抱歉,埃隆,X。

对于那些初学者来说,尤其如此,他们在求职面试中争取获得第一个数据科学职位。

然而,通过正确的准备和心态,你可以自信地应对这些面试并留下深刻印象。以下是一些帮助你在初级数据科学职位面试中成功的技巧。

1. 彻底理解基础知识

你需要对基础概念如统计学、线性代数和编程有坚实的掌握。面试官通常会在深入更复杂的主题之前测试这些基础知识。

这些技能通常包括:

  • 统计学

  • 编程

  • 数据处理

  • 数据可视化

  • 关系型数据库

  • 机器学习

成功应对初级数据科学职位面试的技巧

统计学

面试官期望的基础统计知识,即使是初学者,也包括这些统计概念。

*** 描述性统计:

  • 中心趋势度量——均值、中位数和众数

  • 离散度量——范围、方差、标准差和四分位差

  • 形状度量——偏度和峰度

*** 概率:

  • 基本概率概念

  • 条件概率和贝叶斯定理

  • 概率分布——正态、二项、泊松及其他

*** 推断统计:

  • 抽样——总体、样本、抽样技术

  • 假设检验 – 原假设和备择假设,I 型和 II 型错误,p 值和显著性水平

  • 置信区间 – 基于样本数据估计总体参数。

*** 相关性与协方差:

  • 理解两个变量之间的关系及其相互依赖性

  • Pearson 相关系数

*** 回归分析:

  • 简单线性回归 – 两个连续变量之间的关系

  • 多重回归 – 扩展到多个自变量

*** 分布:

  • 正态分布

  • 二项分布

  • 泊松分布

  • 指数分布

编程

你需要精通在数据科学中常用的编程语言。最受欢迎的三种语言是:

  • SQL

  • Python

  • R

你不需要在所有三种语言中都是专家。通常,精通一种语言并至少熟悉另外两种语言中的一种的基础知识就足够了。

一切都取决于职位描述。不同的公司和职位需要不同的语言。在数据科学中,通常是提到的三种语言中的一种。

如果你问我应该学习哪一个,只有一个的话,我会选择 SQL。查询数据库是数据科学家无法缺少的基础。SQL 专为此设计,没有其他语言能像它一样处理数据清理。

它也可以轻松与其他语言集成。这样,你可以利用其他语言完成 SQL 不适合的任务,例如,构建模型或数据可视化。

数据处理

这指的是你清理和转换数据的能力,包括处理缺失数据、异常值和变量转换。

这意味着你需要了解最受欢迎的数据处理库:

数据可视化

你必须了解不同类型数据和洞察的最佳可视化技术。你还必须知道如何使用可视化工具将其付诸实践:

关系型数据库

作为数据科学家,你需要对关系型数据库及其工作原理有一个基本了解。如果你至少对使用 SQL 进行查询有基本知识,那更好。

一些最受欢迎的数据管理系统包括:

机器学习

你必须熟悉机器学习的基础知识。例如,了解监督学习与无监督学习的区别

你还需要熟悉分类、聚类和回归。这包括了解一些基本算法,如线性回归决策树支持向量机朴素贝叶斯k 均值

2. 了解你的工具

在面试前,熟悉流行的数据科学工具。这包括我们已经提到的编程语言,还包括一些其他平台。

你不需要了解所有工具。但如果你能在每个类别中至少有一个工具的使用经验,那将是理想的。

成功导航初级数据科学职位面试的技巧

3. 准备编码和技术问题

使用如StrataScratchLeetCode等平台来准备编码和技术问题。

此外,利用 YouTube 频道、博客和其他资源来复习其他技术概念。如果你专注于“彻底理解基础”中提到的内容,你会做得很好。

模拟面试可以非常有帮助。利用提供模拟面试的在线平台,或者与朋友和导师进行练习。

所有这些准备技巧将帮助你熟悉面试格式并改善你的回答。

4. 展示实际经验

如果你曾参与过个人项目或实习,利用它们来为自己加分。在面试中讨论这些经历,以突出你所面临的挑战、实施的解决方案和取得的成果。

5. 复习行为问题

技术技能通常占据了大部分招聘过程。然而,公司通常会花一些时间来回答行为问题。

这是可以预期的,因为你将与团队合作。面试官会想知道你如何与同事沟通、理解团队合作、处理压力和冲突,或者解决问题的方式。

准备一些来自你过去经历的例子,展示你的软技能和解决问题的能力。

6. 保持更新

数据科学正在迅速变化。因此,你需要保持对最新趋势、工具和技术的了解。阅读相关内容,加入在线论坛,参加网络研讨会,并参与工作坊,以保持自己与时俱进。

但是,不要过于执着于必须了解每一个新的“必备”或“必知”产品。

7. 提问

根据面试的形式,你可能会有机会在面试过程中或结束时提问。

这是你向面试官展示你对角色和公司的热情的机会。同时也是了解他们期望的机会。

询问团队当前的项目、公司的数据基础设施、计划以及他们面临的挑战。

8. 不要忘记软技能

除非结合了出色的沟通技巧,否则你的技术技能不会带来太大帮助。你将需要与技术和非技术团队成员及相关方沟通和合作。

在面试中,回答要清晰简洁。展示你将复杂话题简单解释的能力。这将向面试官展示你能够与非技术团队成员有效合作。这是一个非常重要的技能,因为数据科学并不是孤立存在的,其发现常常被非技术人员使用。

9. 保持冷静,继续前进

紧张是很自然的。只要不要因为紧张而更紧张!始终记住,面试官寻找的是最佳候选人,而不是完美的候选人。这里的最佳是指我们提到的所有要点的最佳组合。

如果在面试的某个阶段出现失误,不要失去信心——保持冷静,继续前进!候选人往往夸大自己错误的影响,而这些错误对面试官的印象可能几乎没有负面影响。

记住,面试不仅是让你了解公司,也是让公司了解你的机会。保持冷静,深呼吸,自信地回答每一个问题。

当然,自信不能伪造。它最好通过前八条建议的扎实准备来实现。

结论

是的,技术知识对于数据科学角色至关重要,即使是初级职位。但软技能、实践经验和对该领域的真正热情同样重要。

面试官主要寻找的是一个完整的候选人。这九条建议将涵盖所有要点。

现在,你需要给自己时间进行充分的准备。如果你对自己的准备水平有信心,带着积极的心态去面试会更容易。这样,你已经在通往获得第一份数据科学工作的道路上迈出了重要的一步。

祝好运!

内特·罗西迪 是一名数据科学家和产品策略专家。他还是一名分析学兼职教授,并且是 StrataScratch 的创始人,这是一个帮助数据科学家通过顶级公司的真实面试问题为面试做好准备的平台。可以在 Twitter: StrataScratchLinkedIn 上联系他。

更多相关内容