剑客
关注科技互联网

抢当大数据科学家,5大特质你有吗?

抢当大数据科学家,5大特质你有吗?

大数据科学家有多夯?让我们从有史以来市值最高的科技公司苹果看起。为抢大数据科学家,苹果开出美金16万到20万(约合台币400万到600万)的年薪,以及任何你想得到的好康福利:美味员工餐、健身中心、教育津贴甚至冻卵补助,但苹果不是唯一一个需要数据科学家的公司,打开领英(LinkedIn),上头至少有5万3千个数据科学家的职缺,而这还只是美国的统计数字。
美国专业招聘公司罗致恒富(Robert Halt)公布的《2015薪资指南》把大数据工程师列为今年薪资涨幅最大的六大行业之一,预计薪资年成长率9.3%,平均年薪119,250美元至168,250美元,在国内根据经验平均也有100万到500万的薪资行情。
鼎鼎大名的数据科学家你也许听过不少,诸如美国白宫首席数据科学家帕帝亚(DJ Patil)、被选为全美Top 4技术长的宝立明又或者是阿里巴巴集团大数据的第一把交椅车品觉,但这些如雷贯耳的大数据科学家动辄掌管一个个国家或跨国企业的海量数据,彷彿离一般人很遥远。其实,现在各行各业都亟需大数据科学家,你也可以加入大数据淘金潮,但到底什麽样的人才适合做大数据的工作呢?想要抢搭大数据人才热潮,晋身高薪一族,又需要注意哪些事情?
大数据行动广告平台威朋是一家藉由分析行动装置的数据,为客户找到精准行销目标的数据管理平台(DMP)与即时广告竞价(RTB)投放公司,业务横跨台、日、中、港等地,数据分析为其业务核心,数据分析部门佔其人员大宗,威朋数据科学研发经理彭智楹与张嘉祜分别拥有多年数据分析经验,现身说法分享数据科学家到底在做什麽以及如何成为数据科学家。
张嘉祜和彭智楹皆毕业于资工系,在学期间就已开始从事资料分析工作,每日需与大量数据为伍,两人皆认为在学校所学的知识和技能有助于他们进入职场从事相关工作。张嘉祜念博士时分析大量的影音多媒体资料,而彭智楹曾与生物学家合作分析生物影像,分析影像资料看似与分析广告数据大不相同,但其实背后原则相差不远,重点都是要从茫茫资料海中找到有价值的资讯,只是资料种类不同而已。
两人的工作虽然都是大数据分析,但张嘉祜更专注于帮助线上广告投放达到最大效益化,偏向商业智慧分析,并且发展帮助其他同事可以快速找到问题答案的工具,快速从大数据中检索需要的统计资料,帮助客户改善行销策略。另一方面,从市场反应决定要做出什麽相对应措施,时常与点击率、转化率和流失率等数据为伍。而彭智楹则负责开发资料探勘系统、写演算法和机器学习,例如预测点击率,判断使用者打开App时点击广告的机率有多大,较偏向于垂直面的研究。


特质一:定义和釐清问题 谈及好的数据科学家具备什麽条件,彭智楹认为可以分成两种等级:一种是是别人帮你把问题定义好,然后你来解开,但更厉害的是你知道怎麽找问题,什麽问题才是重要的,自己发现问题。「你要定义最有前瞻性最重要的问题,结果不只正确还要显著性,对各领域发展有贡献,要有商业价值和技术进步的空间,两者能兼备是最好的。」彭智楹说。张嘉祜也认为在分析数据时,定义问题的能力很重要,因为问题分成很多层面,数据科学家必须要看当下要解决什麽问题,再用那个指标去回答。因此数据科学家首要具备的条件就是:定义和釐清问题。



特质二:想像力

不要以为数据科学家整天在电脑前面工作,只要一板一眼地分析数据就好,其实想像力也很重要。张嘉祜根据自己的工作经验指出,有一定的创意才能帮助自己找到不一样的观点,学校会训练你使用习惯的工具,但你应该要尝试各种可能,如果没有专业知识判断,最后得到的结果就会跟大家差不多。

例如在威朋工作常会需要帮助客户找到具有某种特徵的族群,这个时候若只靠经验和专业是不够的,还需要发挥一些想像力。「我们在描述一个人的行为倾向时是很多维度的东西去做整合,除了你对生活经验的丰富度之外,你还要有创意去描述这种人具有什麽样的行为特徵,我们再透过机器学习的辅助,帮助你快速收敛这些特徵背后隐含的意义是什麽,不然一般人就是我想到什麽样的资讯我就勾一勾,这样不够。」张嘉祜说。



特质三:逻辑思考能力

数据科学家的工作时常需要建立假设然后去验证它,并且建立模型,这个过程仰赖优秀的逻辑思考能力,否则追寻答案到一半可能不小心就会走到岔路。大学时期双修物理和心理学的彭智楹认为,心理系的训练帮助他可以更容易了解他人的动机和想法,也因此在分析数据时常有意想不到的收穫。

以数据科学家最讨厌的机器人为例,这类的假数据抓不胜抓,又会影响到统计结果,令人不堪其扰,但彭智楹认为与其去思考机器人在哪裡,要怎麽抓,不如反向思考什麽样的网页需要机器人,机器人的数据从哪裡来,就像是侦探福尔摩斯一样,「侦探怎麽找出犯人,他不是从犯案手法去看的,而是从动机。」

威朋大数据科学家



特质四:基础数理与资讯工程能力

虽然彭智楹和张嘉祜都同意数据科学家不一定非得要是理工学院或电资学院出身的,但也都异口同声地指出数据科学家还是必须具备基础数理与资讯工程能力。

张嘉祜说,你也许可以用Excel去处理数据,但如果想要加快资料处理速度的话,程式能力依然是必须的。彭智楹认为不能害怕数字很重要,必须要培养对数字的敏锐度,例如他在念博士时就会用眼睛观察数列是否有周期性的变化,从中训练自己对数字的敏锐度,他甚至写了一个产生各种乱数模型的程式,然后用眼睛一一把每个数字看过一遍,分析影像时也一样,每张影像他都一一检视过,「什麽时候要把资料分开或结合看,这都需要经验。」彭智楹说。

但在工具之外,张嘉祜认为最重要的还是商业嗅觉,现在很多人随随便便就说自己会做数据分析会用什麽资讯工具,但没有商业眼光依然白搭。



特质五:跨界合作能力

最后,由于大数据科学家必须胆大心细又要天马行空,逻辑好之外还得要融合自身生活经验,这些特质要在一个人身上面面俱到非常困难。张嘉祜指出,跨界合作能力在这裡就显得格外重要,因为不同的产业别需要不同的观点,如果不懂得倾听别人的意见,恐怕陷入盲点而不自知,跨界合作有助于发现不同面向切入分析,更有效率地做决策。

和沛科技创办人翟本乔曾说:「在大数据领域的英雄不是图灵,也不是克劳德·夏农(发明资讯概论的人),而是福尔摩斯,这种有点自闭但能够看出事情关键的人,如果只是因为大数据很红就去学这些工具,你学这些工具就是赚22K的,把专业领域做好,你可以赚2200K。」因此,与其盲目追随大数据热潮,不如看看自己是否具备这些特质以及专业,再来决定要不要加入大数据淘金潮。

End.

作者:Python中文社区(中国统计网特邀认证作者)

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址