时间:2016-11-4来源:本站原创作者:佚名
数据科学家常用的10种编程语言和工具

SAP大中华区副总裁刘伟曾经在DTCC大会上说过:“数据科学家是21世纪最性感的职业”。那么要进入数据科学领域应该掌握哪些技能?如何从一个数据分析师转变角色成为一个数据科学家?首先你要对数据科学家这份工作做一个研究,例如数据科学家需要掌握哪些数据科学工具和编程语言?一般来说,R和Python是需要重点掌握的。如果你已经掌握了一些编程语言,那么你就应该   

数据分析和数据科学家是一个很好的职业发展方向。职业网站Glassdoor将数据科学家评为美国最好的工作。据悉,数据科学家的平均年薪为美元,目前有很大的市场需求。同时,数据科学家也荣登Glassdoor的bestWork-LifeBalance名单。

  

我们采访了当前的数据分析师和数据科学家,总结了他们认为从事数据科学必备的技能、语言和工具。接下来,我们就来看一下到底有哪些工具和编程语言受到了数据科学家的青睐。

◆◆◆

R

  

数据科学家和分析人员有两大神器,其中之一就是R。R是由RossIhaka和RobertGentleman创建的开源语言,主要用于数据分析和数据可视化。R有非常活跃的用户社区,社区提供R安装包,也会对R的相关问题进行解答。R语言已经引起了很多企业的重视。微软旗下的企业平台支持R语言。

◆◆◆

Python

  

数据科学家的另一个神器就是Python。Python最早出现在年,是由GuidovanRossem创建的。如果你准备从事数据科学家和分析师的工作,那么你首要掌握的技能就是R或Python。Python是一款较为通用的语言,被Datacamp网站评为最适合编程初学者的语言。相对来说,R的学习曲线较为陡峭。

◆◆◆

Scala

  

Scala集成了面向对象编程和函数式编程的各种特性。它是实时数据处理最流行的语言。它是很多流数据技术的实现语言,例如ApacheSpark和ApacheKafka。OReilly的年数据科学薪酬调查指出,Scala工程师的薪资在年上涨了10%。

◆◆◆

SQL

  

SQL虽然不应用于大数据,但仍然是数据分析中非常受欢迎的工具。OReilly的调查指出,68%的受访者表示他们在使用SQL。SQL是关系数据库管理系统的标准语言,现在仍有很多的传统企业在使用RDBMS。因此,SQL仍然是企业组织的重要工具。

◆◆◆

Excel

  

即使是在高级工具层出不穷的时代,Excel仍然是一个很流行的工具。据OReilly的调查,59%的数据科学家和分析师在使用Excel,而且和去年同期相比,Excel的使用率没有下降。Excel是数据分析的主力,因为它的普遍性和易用性,成为了非程序员和分析师的首选工具。

◆◆◆

SAS

  

SAS进入了Gartner高级分析平台魔力象限的领导者象限,无论是在前瞻性还是执行力都表现出色。SAS是由美国NORTHCAROLINA州立大学年开发的统计分析软件,直到现在,仍然焕发着勃勃生机,是现下流行的数据分析工具。数据科学家使用Crowdflower对LinkedIn上数以千计的招聘信息进行了分析,发现SAS的需求量大概在15%~20%之间。

◆◆◆

Java

  

据Crowdflower分析显示,数据科学家这项工作对Java的要求提高了,LinkedIn上大约有35%~40%的数据科学家招聘广告中都明确要求有Java工作经验。OReilly的调查显示Java的使用率从年的32%下降至年23%,但是有25%的受访数据科学家表示Java是他们的常用语言。

◆◆◆

MatLab

  

MatLab是MathWorks公司年开发的商业数学软件,在学术界的影响力很大,主要用于数据采集和数学建模。OReilly的调查显示,MatLab的使用率出现了下降,但是Crowdflower分析则表示,目前MatLab的市场空缺达到了85%-90%。

◆◆◆

SPSS

  

SPSS让IBM进入了Gartner高级分析平台魔力象限的领导者象限。现在,许多大学都采用SPSS技术来进行他们的学位工作。SPSS于年被IBM收购,现在旗下已经有一系列的子产品。

◆◆◆

Julia

  

Julia相比于其他工具是一个比较新的工具,知名度不是很广。Julia的主要应用场景是培训咨询和商业支持。VentureBeat认为Julia是一款可以替代数据科学专有工具的免费工具,相比于Python和R语言更为现代。









































白癜风的治疗
白癜风的发病原因

转载请注明原文网址:http://www.gzdatangtv.com/bcyyfz/1405.html
------分隔线----------------------------