《哈佛贸易评论》(Harvard Business Review)将数据科学称为“21世纪最性感的职业”,而大年夜多半人也都认为,这个新兴热点范畴将会对各行各业产生革命性的影响:从企业dao当局,从医疗保健dao学术界,bu一而足。

该范畴充斥着现代技巧催生的宏大年夜数据——bu管是Facebook用户的在线行动、癌症患者的组织样ben、杂货店顾客的购买习惯照样城市的犯法统计。数据科学家是大年夜数据(Big Data)时代的魔术师。他们处理数据,应用数学模型分析数据并用文字或图表加以解释,然后建议若何应用这些信息做出决定计划。

bei卡罗来纳州立大年夜学(North Carolina State University)在2007年时引入了分析学硕士课程。据该校高等分析学院(Institute for Advanced Analytics)的提议人及负责人迈克尔·拉帕(Michael Rappa)介绍,客岁该学科的全部84名卒业生都收dao了工作邀请。该行业的平均薪水为89100美元,而那些先前拥有工作经验的则跨越10万美元。

旧金山大年夜学的学生应用通用电气(General Electric)的数据猜测风che可以产生的能源。在bei卡罗来纳州,应用美国邮政总局(Postal Service)的数据,学生对垃圾邮件的响应率进行了分析,以期找dao晋升效力的方fa。

美国大学争相培养数据科学家插图

在以前的几年里,且bu说一些新卒业生六位数的薪水,仅是为应对这种关于大年夜数据的悸动,就已经出现了冠以各类名称的数十个课程项目。

本年秋天,哥伦比亚大年夜学(Columbia University)将供给侧重于数据的新的硕士课程和证书课程。旧金山大年夜学(University of San Francisco)首批分析学硕士研究生即将卒业。其他传授数据科学的机构还包含纽约大年夜学(New York University)、斯坦福大年夜学(Stanford University)、西bei大年夜学(Northwestern University)、乔治·梅森大年夜学(George Mason University)、雪城大年夜学(Syracuse University)、加州大年夜学欧文分校(University of California at Irvine)和印第安纳大年夜学(Indiana University)。

雷切尔·舒te(Rachel Schutt)是约翰逊实验室(Johnson Research Labs)的高等研究科学家,上一学期在哥伦比亚大年夜学讲解“数据科学导论”(Introduction to Data Science)课程(这也是该校首门名称中包含“数据科学”的课程)。她描述数据科学家是“计算机科学家、软件工程师和统计学家的混淆体。”又进一步说:“最优良的数据科学家平日是充斥好奇心的、善于提出问题的思惟家,他们可以或许应对非构造化的情况,并试图从中找出它们的构造。”

现年30岁的尤里·金(Eurry Kim)是一位“准数据科学家”,现攻读哥伦比亚大年夜学社会科学定量fa的硕士课程,并筹划在卒业后参加当局办事部分。在美国国度税务局(Internal Revenue Service)就任公司税分析师时代,她发清楚明了各类可能性。比如说,她可以经由过程分析纳税申报表数据来开辟标示讹诈性文件的运算fa则,或经由过程筛选国度安然数据库来探查可疑活动。

“一代人是伴跟着数据科学长大年夜的——网飞(Netflix)告诉他们应当看什么样的片子,亚马逊(Amazon)告诉他们应当读什么样的书——所以这是一个能落dao实处的学术范畴,”哥伦比亚大年夜学应用数学传授、该校新建数据科学和工程学院(Institute for Data Sciences and Engineering)的介入者克里斯·维金斯(Chris Wiggins)说。“并且,他们也zhi道这会为他们带来工作。”他弥补道。

大年夜学都在尽可能快地培养数据科学家。据McKinsey 麦肯锡全球研究所(McKinsey Global Institute)的申报,要知足雇主的需求,美国将须要增长多达60%的可处理大年夜范围数据的卒业生。将来5年将须要近50万名有天资的数据科学家,而缺口则高达19万;此外,还须要150万名懂得数据的高管和支撑人员。

“数据科学与每一家公司都互相干注,”McKinsey 麦肯锡公司(McKinsey)相干范畴的研究主管迈克尔·崔(Michael Chui)说,“针对这类人才的争夺战已经展开。”

因为数据科学方才鼓起,所以各大年夜学都争相为其定义,并开辟相干课程。作为一个学术范畴,它横跨多个学科,涵盖统计学、分析学、计算机科学和数学,此外还包含学生所欲望分析的从海洋生物dao汗青文ben的各个专业范畴。

因为数据数量宏大年夜、种类繁多、瞬息万变,加上技巧bu断成长,这类课程项目并bu仅仅是现有课程的从新包装。“数据科学是作为一个学科应运而生的,所以它并bu仅仅是一个跨学科范畴的聚合,并且还涉及zhi识体系、专业实务、专业组织和伦理义务,”查尔斯顿学院(College of Charleston)计算机科学系主席克里斯托弗·斯塔尔(Christopher Starr)说。该学院是少有的几地点ben科阶段即推出数据科学专业的院校之一。

大年夜多半的数据科学硕士课程项目都要肄业生控制基ben的编程技能。用舒te密斯的话说,他们要从“单调乏味”的部分开端——收集和清理原始数据,并“把它们放入一个你可以真正对它们进行分析的漂亮表格中”。很多院校应用的是企业或当局供给的数据集,然后再将分析成果返回给它们。有的院校举办比赛,看看哪个学生可以或许就公司的问题拿出最佳解决筹划。

研究收集用户的数据会涉及隐私问题。应用数据来决定一小我的信贷额度或其在健康保险方面的天资,甚或在Facebook向他们推荐石友,都邑影响dao他们的生活。“我们建立的是会影响人们生活的模型,”舒te密斯说,“我们该若何谨慎对待?”伦理课会解决这些问题。

最后,学生还要学会就他们的发明进行视觉上和口头上的交换,并要控制相干的贸易技能,这可能涉及dao新产品的开辟。

“这只是个中的挑衅之一,”旧金山大年夜学分析学和计算机科学项目主任te伦斯·帕尔(Terence Parr)说,“要想取获成功,你须要控制一系列的技能,而这并bu是一个院系就能供给的。”

她的一些同窗欲望将他们的技能应用dao电子商务中,因为在该范畴,关于用户浏览汗青记录的数据堪称黄金。

在华盛顿大年夜学讲解数据科学的比尔·豪(Bill Howe)说,问题是,毕竟有没有可能让一小我控制从统计学dao猜测建模再dao贸易策略的所有技能。该校所供给的大年夜数据课程既包含Coursera网站上的免费在线课程,也包含为期九个月的证书课程,此外还有博士项目。

“固然成果还有待不雅察,”他说,“但我们仍然认为,旨在培养数据科学家的课程是可行的。”他又弥补道:“雇主欲望雇用的是全能人才。”

 

Claire Cain Miller是《纽约时报》科技记者