如果这样类比,数据科学家就是一群很难算得上是科学家的人。那么事实到底是不是这样呢? “数据科学家”这个新称谓近两年才被叫响。大数据与数据科学家有着千丝万缕的联系,因此容易让人产生一种错觉,数据科学家是大数据时代特有的一类专才。 尽管大数据项目的实施在没有数据科学家的情况下也能够成功地完成,但有鉴于数据科学家将成为大数据项目的工具、系统和输出的最终用户,数据科学家在大数据项目的计划阶段至关重要。 自己培养数据科学家 在品友互动其实并没有数据科学家这个职位,有的只是算法工程师、数据工程师等,他们从事的是数据科学家的工作。 从统计思维到数据思维的突破 数据科学家到底应该具备哪些基本的素质和能力呢? 陈弢认为,数据科学家首先要具备科学家的基本素质,即客观、诚实和严谨。
经常有人问我“要成为数据挖掘工程师或者数据科学家应该读什么书?”类似的问题。下面是一份建议书单,同时也是成为数据科学家的指南,当然,这不包括取得合适大学学位的要求。 在深入探讨之前,数据科学家似乎需要掌握许多技巧,如:统计学、编程、数据库、演讲技巧、数据清理与变换知识。 ? 理想情况下,你需要具备以下技能: 了解统计学与数据预处理知识。 理解统计陷阱。 信息提取与文本分析是数据科学家需要掌握的重要技能。 结语 最后,这里还有一些数据科学家不该错过的书籍: Data Mining and Statistics for Decision Making by Stéphane Tufféry (A personal
在互联网企业中,LinkedIn是一家出了名的“慢公司”,但LinkedIn也是最成功的社交网络,用户品质、广告价值都是行业翘楚,秘密在于LinkedIn有一个高效的数据科学家团队。 为什么人们现在如此的关心统计和数据,为什么数据科学家成了最性感的工作, 最近,在TiE的峰会上, LinkedIn的首席数据科学家Manu Sharma 接受了采访, 揭秘了LinkedIn的数据分析的工作 数据科学家需要具备好奇心和直觉。 他们需要想的问题是:我能用这些数据来做什么呢? 我需要问什么样的问题?这些数据能告诉我什么? 他们还需要足够的直觉来了解他们所采用方法的局限性。 数据科学家的工作包括, 采集数据, 整理数据, 建立正确的模型, 测试模型, 还要有一定的编程能力。 一个数据科学家需要具备这些技能, 而这些技能也是一个初创企业在建立它的数据科学家团队所需要的技能。 问: LinkedIn数据应用的重点是那几个方面?
管理决策层在搭建其数据科学家团队时,有时也不是很清楚他们想要的到底是什么。他们往往最终招募的是很纯粹的技术极客、计算机科学家,或者缺乏恰当大数据经验的人。 事实上,你可以成为一名真正的数据科学家,且不需要掌握这些技能。NoSQL和MapReduce不是新概念——在这些关键词被创建之前,就有很多人接触到它们。 成为一名数据科学家,你需要以下能力。 数据科学家在商业分析、统计学和计算机科学等领域也是通才,比如会掌握这些专业知识:健壮性、实验设计、算法复杂度、仪表盘和数据可视化。 一些数据科学家也是数据策略师——他们可以开发数据收集策略,并使用数据来发现可操作的、能对商业产生影响的见解。这就要求数据科学家具有创造性,能根据业务要求,制定分析、提出解决方案。 本文选自《数据天才:数据科学家修炼之道》
摘要:R是非常流行的数据统计分析和制图的语言及环境,有调查显示,R语言在数据科学家中使用的程度仅次于SQL,但大数据时代的海量数据处理对R构成了挑战。 摘要:R是数据科学家中最流行的编程语言和环境之一,在Spark中加入对R的支持是社区中较受关注的话题。 作为增强Spark对数据科学家群体吸引力的最新举措,最近发布的Spark 1.4版本在现有的Scala/Java/Python API之外增加了R API(SparkR)。 项目背景 R是非常流行的数据统计分析和制图的语言及环境,有一项调查显示,R语言在数据科学家中使用的程度仅次于SQL。 为了方便数据科学家使用Spark进行数据挖掘,社区持续往Spark中加入吸引数据科学家的各种特性,例如0.7.0版本中加入的python API (PySpark);1.3版本中加入的DataFrame
关于数据科学家的更多讨论: 你能列出十个著名的女性数据科学家吗?Can you name 10 famous data scientist women? 谁是最富有的数据科学家? 数据科学的从业者被称为数据科学家。数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。 John Rauser, 亚马逊大数据科学家: 数据科学家是工程师和统计学家的结合体。 Daniel Tunkelang,LinkedIn首席数据科学家: 我是bitly 首席科学家Hilary Mason的忠实崇拜者。 (决策力) 三、数据科学家所需硬件技能 (1) 计算机科学 一般来说,数据科学家大多要求具备编程、计算机科学相关的专业背景。
谁是数据科学家? 他/她是否整日忙于数据或在他/她的实验室中尝试复杂的数学?毕竟,“谁是数据科学家”? Ť 这里有对数据科学家提供了一些定义。简而言之,数据科学家就是实践数据科学艺术的人。 数据科学家是业务分析师还是数据分析师,两者有所不同! 尽管所有这些学科的初始培训或基本要求都是相似的,但数据科学家需要: ? 当今的数据科学家面临的主要挑战不是找到现有业务问题的解决方案,而是确定对组织及其成功至关重要的问题。 为什么数据科学家被称为“数据科学家”? 数据科学家具备哪些技能? 数据科学家的作用确实是具有挑战性的!尽管数据科学家使用的技能和能力差异很大,但要成为一名高效的数据科学家,他应该: 1. 数据科学家就像网站管理员一样,不仅需要成为所有行业的杰作,而且还需要掌握以上领域中的至少一个。 数据科学家做什么呢? 数据科学家扮演着双重角色-“分析师”和“艺术家”!
技术技能:分析学 1 教育 数据科学家受教育程度都很高,其中88%至少拥有硕士学位,46%有博士学位。虽然有一些名人特例,不过通常来说成为一名数据科学家需要扎实的教育背景,才能掌握所需的深度知识。 6 非结构化数据 数据科学家能够处理非结构化数据这一点非常重要,无论这些数据是来自社交媒体、视频源或者音频的。 非技术类技能 7 求知欲 毫无疑问最近到处都能看到这个词,尤其是在与数据科学家关联时。 8 商业智慧 想要成为数据科学家,需要充分了解自己工作的行业,并且知道公司想要解决的商业问题是哪些。 网上有很多资源,不过笔者不希望让读者产生这样的错觉——成为数据科学家非常简单,上几节MOOCs就够了。除非你有扎实的定量经验,否则成为数据科学家之路还是颇有挑战的——但也并非不可能。 8 Burtch Works研究:关于数据科学家的薪金,如果想要了解更多信息与当前数据科学家人数统计的话,请下载我们的数据科学家薪金研究报告。
员工:当然,我还能把它们相乘 但如何能成为一个数据科学家呢? 首先,各个公司对数据科学家的定义各不相同,当前还没有统一的定义。 但在一般情况下,一个数据科学家结合了软件工程师与统计学家的技能,并且在他或者她希望工作的领域投入了大量行业知识。 因此,排除一个数据科学的学位计划(世界各地的著名大学雨后春笋般的出现着),你需要采取什么措施,成为一个数据科学家? 3 学习代码 数据科学家必须知道如何调整代码,以便告诉计算机如何分析数据。从一个开放源码的语言如Python那里开始吧。 8 练习 在你在新的领域有一个工作之前,你如何练习成为数据科学家?使用开源代码开发一个你喜欢的项目、参加比赛、成为网络工作数据科学家、参加训练营、志愿者或实习生。
人们最常见的偏见就是,认为统计学家就是数据科学家或者具有分析背景的商务智能专家会是一个好的数据科学家。也许在某些情况下这是正确的,但也有例外。 那么,成为真正的数据学家(DS)需要具备怎样的技能呢? 数据科学家需要在这些讨论的初期就参与进来,迅速掌握概念,并积极参与制定交付清单。 4. 可视化:传统可视化往往不能显示高级分析的结果。数据科学家需要了解各种可视化工具和技术。 5. 数据科学家需要推动这一迭代过程。此外,数据科学家还需要将分析结果呈现出来。为此,需要良好的故事叙述能力。 6. 好奇心:根据分析的业务/主题,数据科学家可能不是此领域的专家。 创造力:数据科学家需要在上述所有技能中使用大量的工具和技术。为了做到这一点,数据科学家在如何使用这些工具和技术方面应该发挥创造力。 常识:最后但同样重要的是,数据科学家在执行行动的时候应该明智运用常识。如果一个案例只需要线性回归和条形图,那么数据科学家不应该过度设计它。
Software engineer’s guide to getting started with data science 数据科学家修炼指南 December 30, 2012 By prasoonsharma GETTING STARTED 开始 a) Self-learning (2 - 4 months) 自学(2-4个月) Explore if data science is for you 看看数据科学家是不是适合你
RoadMap.jpg 资料来源
这是国外数据科学学习平台DataCamp成员写的一篇图文 8步 成为数据科学家。我们具体来看下有哪些学习内容和学习资源。 这里说的8步,不是你用8周就可以完成,而是一种学习的方法。 首先,什么是大数据科学家? 数据科学家是一个跨学科人才,是比软件工程师更擅长统计学,比统计学家更擅长软件工程的人。需要掌握的知识有数学统计,编程能力,机器学习,研究能力等。 目前,数据科学家大部分是本科或者硕士学历(本科37%,硕士31%)。但是不要担心,从调查数据来看,有5%高中毕业的人也成为了数据科学家。这足以证明,只要你努力去提供自己,英雄是不问出处的。 数据科学职业发展规划www.zhihu.com 第6步:多实践,与数据科学家大牛多交流 幸好是互联网时代,我们可以通过网络认识大牛,并从他们分享的知识内容中学到更多经验知识。 www.zhihu.com 第7步:实习、实战、或找份工作 判别自己是不是一个真正的数据科学家的最佳途径,就是用你新学的知识迎难而上,进入数据分析的工作领域。 如何求职?
在本书最开始的部分在对科学家的特征进行归纳的过程中其实已经明确过了,科学是测量的学科,是量化计算的学科,而且即便不具备突破性也需要精确性和体系性这两个最为基本的特性。
但如何能成为一个数据科学家呢? 首先,各个公司对数据科学家的定义各不相同,当前还没有统一的定义。 但在一般情况下 ,一个数据科学家结合了软件工程师与统计学家的综合技能,并且在他或者他希望工作的领域拥有大量的行业知识和经验。 ? 大约90%的数据科学家至少有大学教育及以上经历,甚至到博士以及获得博士学位,当然,他们 获得的学位的领域非常广泛。 ? 一、擅长统计学、数学和机器学习。 在你在新的领域有一个工作之前,你如何练习成为数据科学家?使用开源代码 开发一个你喜欢的项目、参加比赛、成为网络工作数据科学家、参加训练营、志愿者或实 习生。 目前,PPV课已开通数据科学家栏目,并且每日为大家带来大数据行业最新最干货的内容,欢迎大家关注微信公众号(ppvke123)。
员工:当然,我还能把它们相乘 但如何能成为一个数据科学家呢? 首先,各个公司对数据科学家的定义各不相同,当前还没有统一的定义。 但在一般情况下,一个数据科学家结合了软件工程师与统计学家的技能,并且在他或者她希望工作的领域投入了大量行业知识。 大约90%的数据科学家至少有大学教育经历,甚至到博士以及获得博士学位,当然,他们获得的学位的领域非常广泛。一些招聘者甚至发现人文专业的人们有所需的创造力,他们能教别人一些关键技能。 因此,排除一个数据科学的学位计划(世界各地的著名大学雨后春笋般的出现着),你需要采取什么措施,成为一个数据科学家? 1、复习你的数学和统计技能。 在你在新的领域有一个工作之前,你如何练习成为数据科学家?使用开源代码开发一个你喜欢的项目、参加比赛、成为网络工作数据科学家、参加训练营、志愿者或实习生。
【节选自即将由电子工业出版社出版的《数据科学家养成手册》第二章】 科学之科 在中国古汉语体系中多为单字词,所以大家想想也能猜得出“科学”一词其实并非中国所发明。 的确,“科学”是个舶来的词汇。
【节选自即将由电子工业出版社出版的《数据科学家养成手册》第一章】 什么是科学家 从我们每个人上学前班的时候,我们就开始受到各种各样的启蒙教育,哪怕是捏橡皮泥、跳皮筋、玩弹球这些最最普通最最不起眼的游艺项目 在我们印象中的科学家通常都是天资聪颖,智慧出众,在某一领域理解深刻的。科学家与我们常人都有哪些区别呢?是因为他们更聪明所以才能当科学家吗?是他们记忆力殊绝于人才能当科学家吗? 是因为他们有更好的坚忍不拔的性格才能克服困难成为科学家吗?我认为这些因素都只是成就科学家的一部分因素,而且既不是充分条件也不是必要条件。 作为一个有知识和有一定文化程度的常人来说,其实很多技术很多科学原理我们都能理解而且加以应用,而且不乏有些人会应用得非常纯熟,但是众多的常人中却很少有能够被称为科学家的。原因何在呢? 这不足为奇,当然更不可能让每个人都因为对这种常识的总结或感知而成为科学家。
作为公司的首席数据科学家,两年来 Matt Pasienski 做的事情就是把乱麻一样的数据变成有意义的信息。但随着数据的汹涌而来, Pasienski 仅仅依靠一张物理学 PhD 文凭已经不够了。 营销人员能理解数据科学家们做的事情么? 我希望营销人员能理解他们本身就有必要成为数据科学家。他们需要陈述数据,理解数据。 为了营销的目的,数据科学家怎样做才好? 甩掉没用的冗余信息。大部分数据科学家都专注于事实和数字,但营销行业里最难做的不仅是从数据中挖掘出意义,还要知道如何表达数据结果。
2.分析能力 第一步只是一个快速了解大体流程的环节,数据科学家最值钱的地方是分析能力以及将分析与商业实践结合的能力。