原文:
www.kdnuggets.com/2022/07/12-essential-vscode-extensions-data-science.html
图片作者
Visual Studio Code (VSCode) 是一个免费的集成开发环境(IDE)。它在开发人员和数据从业者中很受欢迎。VSCode 提供丰富的功能、扩展(插件)、内置 Git、运行和调试代码的能力以及对工作区的完全自定义。你可以在不离开应用程序的情况下构建、测试、部署和监控你的数据科学应用程序。
我尝试过多个 IDE,坦白说,我发现 VSCode 最好,因为它提供了一个轻量级、强大且可定制的工作环境。这个 IDE 最大的优点是拥有大量适用于各种 IT 专业人士的扩展。
在这篇博客中,我们将学习对我的工作区至关重要的扩展。
列表的快速回顾:
-
GitHub Copilot
-
Python
-
Pylance
-
Python Indent
-
Indent-rainbow
-
Jupyter
-
Jupyter Notebook 渲染器
-
R
-
Julia
-
DVC
-
GitLens
-
Todo MD
GitHub Copilot 是你的 AI 助手。它会建议一行或整个函数。GitHub Copilot 使用 OpenAI Codex 提供实时建议。这个扩展的最佳部分是它会根据用户的行为进行学习。每当我需要编写类似的 Python 脚本时,它会建议 注释、函数 和 文档字符串。我只需按下“Tab”键即可。
今天就 注册 以获得技术预览。
Python 扩展提供了语言支持,如代码检查、调试、代码导航、代码格式化、重构、变量查看器和测试查看器。它会自动安装 Pylance 和 Jupyter 扩展,以为你提供最佳的 Python 文件和 Jupyter Notebook 文件体验。
Pylance 与 Python 扩展提供了超级增强的语言支持。它会提供参数建议、代码补全、自动导入、类型检查和语义高亮。它被高度推荐,因为它将我的 Python 开发体验提高了 2X。Pylance 远不止是 Python 的自动补全功能。
Python Indent 是你一直知道你需要的扩展。每当你输入一行代码并按下 Enter 时,它将为你提供正确的 Python 缩进。它与括号对、悬挂缩进、关键字和扩展注释一起工作。
Indent-rainbow 带来了HTML和 Python 编码世界的宁静。我现在可以看到干净且组织良好的缩进。这款扩展帮助我快速调试代码并编写有效的代码。Indent-rainbow 为文本前的缩进上色,每一步交替使用四种颜色。
Jupyter 让你可以在 VScode 中编辑、运行和保存 Python Jupyter Notebook。它简单易用,支持所有编程语言,例如Julia、R、Scala和SQL。它将 Jupyter 功能与 VSCode 扩展结合起来,提供终极的 Python 开发体验。Jupyter 包含快速的 .ipynb
文件加载、notebook diff-tool、Python 和 Pylance 集成,以及代码折叠功能。
我强烈推荐你在 VSCode 中使用 Jupyter Notebook。
Jupyter Notebook Renderers 与 Jupyter 扩展配合使用,提供交互式数据可视化。对于数据分析师、数据科学家和数据工程师来说,这是一个必备的扩展,能够可视化 Plotly、Vega、Bokeh、GIF、PNG、SVG 和 JPEG 输出。
R 扩展提供丰富的语言支持。如果你是数据分析师或研究人员,你一定对 R 语言及其生态系统有所了解。VSCode 扩展通过提供语法高亮、代码分析、R 终端和对R Markdown的支持来增强你的体验。它还允许你查看数据、图表和变量。
Julia 扩展提供类似于 Python 和 R 的语言支持。在我看来,Julia 是机器学习和数据科学的未来。这个扩展带有语法高亮、代码片段、Julia REPL、代码补全、linter、悬停帮助和调试功能。类似于 R,它提供了绘图画廊、表格数据的网格查看器,以及测试、构建和基准测试程序的能力。
DVC 是一个新的扩展,我认为是MVP,用于版本控制和跟踪你的机器学习实验。每个数据团队都依赖它来对数据集进行版本控制,以确保可重现性。除了数据,你还可以对元数据、图表、模型进行版本控制,跟踪和存储实验,创建数据和 ML 管道,并像使用 Git 一样共享。该扩展提供了实验跟踪、仪表板、实时跟踪和基于 GUI 的数据管理功能。
DVC 扩展使大文件版本控制变得更简单和容易。
GitLens 让你的 Git 仓库生动起来。你可以使用交互式用户界面执行所有与 Git 相关的任务,而不是在终端中输入脚本。它包括修订导航、当前行责任、作者、文件 注释、侧边栏视图、Git 命令面板和可定制的菜单和工具栏。通过提供视觉创作、无缝团队协作和分析项目进展的能力,它提升了你的开发体验。
Todo MD 是最佳任务跟踪扩展。你可以找到多个可能对你的特定开发环境有帮助的待办事项扩展,但 Todo MD 允许你设置优先任务,跟踪日常任务、项目、标签和上下文。通过使用 Markdown 语法,你可以创建带有特殊标签的任务列表,例如“逾期”或筛选与你的特定简单标签和特殊标签相关的任务。
我用它来跟踪我的重复任务。例如,运行和自动化用于编辑任务的 Python 脚本。
如果你更关注数据科学解决方案的开发和部署,推荐使用其他扩展,如 GitHub Pull Requests and Issues、Docker 和 Kubernetes。我提到的这些扩展对我来说是日常构建、测试和运行 Python 脚本的必要工具。
如果你有更好的数据科学扩展建议,请在评论中提到。我一直在寻求通过用更好的替代方案替换旧扩展来改进我的工作空间。我目前正在寻找使用 GitHub Actions 自动化我的工作流程,并且我对建议持开放态度。
Abid Ali Awan (@1abidaliawan) 是一位认证的数据科学专业人士,热衷于构建机器学习模型。目前,他专注于内容创作,并撰写有关机器学习和数据科学技术的技术博客。Abid 拥有技术管理硕士学位和电信工程学士学位。他的愿景是使用图神经网络为面临心理疾病困扰的学生开发 AI 产品。
1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。
2. 谷歌数据分析专业证书 - 提升你的数据分析水平
3. Google IT 支持专业证书 - 支持你们组织的 IT 工作