前沿产经网 深度研究产业经济

首页 /  看科技

发现常见数据科学工作神话背后的真相

为您打破数据科学工作神话。

数据科学家开发、维护和评估人工智能解决方案。他或她还参与使用人工智能技术(如H2O、Tensorflow)设计数据解决方案。这项工作包括设计算法、实现管道、验证模型性能和开发接口(如API)方面的技能。关于数据科学的工作有几个误区,在这里,我们将为您分析。

 

数据科学家只是业务分析师的一个别致的名字

数据科学家的工作描述与业务分析师的工作描述根本不同。业务分析师的角色是充当业务和IT之间的桥梁。他们通常收集功能性和非功能性需求,构建用例,与利益相关者沟通,并管理项目交付。另一方面,数据科学家处理数据以发现趋势、收集见解并建立预测模型。下面的维恩图将帮助您描绘一幅清晰的画面。

 

数据科学家、数据分析师、数据工程师都是一样的

当然,数据科学家的确切角色仍然是流动的,因为这个领域仍在不断发展。例如,如果您所在的组织规模较小,则一个人可能会进行数据清理、转换、分析、模型构建等工作。但如果您为一个大型数据科学家团队工作,则您可能会专攻其中任何一个领域。一般来说:

数据科学家负责收集、分析、解释和可视化大型数据集。他们建立假设,测试假设,并从数据中学习。数据分析师执行这些任务的子集,如分析数据和可视化数据。然而,数据分析师可能不会编写代码或建立预测模型。数据工程师负责设计和开发信息系统。

 

数据科学就是工具

与其他工作一样,数据科学家也使用工具完成工作。除了各种开发环境外,他们的装甲还将拥有复杂的数据挖掘、转换、可视化和部署工具。但是知道如何使用这些工具只能让你走到这一步。从根本上说,数据科学家的角色是使用数据解决业务问题。因此,要成为一名优秀的数据科学家,您需要具备解决问题、沟通和逻辑思维方面的技能,以及其他数据准备、探索、评估指标和转换方面的技能

 

数据科学家不编码

今天,数据科学家的每一份工作描述都证明了这是最大的神话之一。因为,如果你是一名数据科学家,你有责任将你的想法付诸实践。因此,您需要编程技能来编写可用于生产的代码。最常用的语言是Python和R,但众所周知,公司也使用Java、SQL、Scala和其他语言。

 

编码背景是数据科学家工作的必备条件

有些人认为数据科学家不编码,而另一些人认为编码是必须的,这可能令人惊讶。但它确实发生了。那么,让我们也来澄清一下。数据科学家来自不同的背景——数学家、统计学家、工程师以及程序员。但我们需要区分“技能”和“背景”。不用说,数据科学家需要编程技能,但不一定需要几年的编码经验。如果你不是一个程序员,你可以学会快速编码并稳步提高。下面是一个关于如何成为程序员的简单指南。

 

数据科学就是预测未来

预测建模是数据科学的一部分,是的。但这不是唯一的部分。事实上,它在数据科学领域占据的空间非常小。今天,数据科学的技术和技术被广泛应用于各个领域——从多语言翻译、图像搜索、视频分析到自动驾驶汽车。如果您有兴趣了解从优步到德里警察局的数据科学领域,请阅读我们关于现实数据科学项目的博客文章。

 

你需要成为数学家或统计学家才能成为数据科学家

这是一个复杂的神话,因为它既真实又错误。数据科学每天都使用数学和统计学的概念。如果不了解概率、线性代数和其他统计概念的基础知识,你就不可能成为一名优秀的数据科学家。然而,你不一定需要持有博士学位。在这些领域也是如此。许多入门或中级数据科学家职位不需要这些领域的正式资格。如果你有一个良好的基础理解,并能将这些概念应用到实践中,你可以成为一名数据科学家。

 

有经验的专业人士无法过渡到数据科学工作

不是真的。作为一个新兴领域,你遇到的大多数资深数据科学家在此之前都做过其他工作。无论你是一位经验丰富的职业专家,工作20年以上,还是一位新手,工作不到5年,你都可以顺利过渡到数据科学工作。