数据科学是一个新兴且日趋成熟的领域,从数据工程和数据分析到机器学习和深度学习,各种工作职能不断涌现。数据科学家必须结合科学,创造性和调查性思维来从一系列数据集中提取含义,并应对客户面临的潜在挑战。从零售,运输和金融,到医疗保健和医学研究,生活各个领域的数据量都在不断增长。可用计算能力的提高和人工智能的最新发展推动了数据科学家的关,像数据科学家一样思考。那么成为一名数据科学家又需要什么呢?高级数据科学家给了关于成功技巧的一些建议 。
高级数据科学家Chu具有人工智能方面的背景知识,尤其是在语言学,语义学和图形学领域,并在新加坡的知名企业工作了两年。
保持好奇心
Chu在接受我们的采访时说,数据科学家应该像调查员一样思考。
您需要通过问“为什么?”感到好奇和兴奋。“这有点像是一个侦探,将他们混在一起,寻找新的线索。”
在金融领域,数据科学家从一系列数据集中提取含义,以告知客户并指导其关键决策。
数据科学家必须着眼于客户想要解决的挑战,并从他们正在使用的数据中获取线索。
通过与Chu交谈,我了解了能够转移重点并考虑调查背景的重要性。
如果无法解决根本问题,那么完美的分析将无济于事。有时,您需要回头,尝试一种新方法并重新构造您要回答的问题。好奇心在于它。您需要爱问题!
要科学
数据科学家使用各种工具来管理其工作流程,数据,注释和代码。
“我必须非常勤奋。我需要衡量和跟踪进度,以便可以备份并尝试新的方向,重用以前的工作并比较结果。
“重要的是要科学,在进行过程中进行观察,实验和记录,以便您可以复制发现。我需要整理我的观察结果,因此我将Noion用作主要工具,将所有笔记,论文和可视化文件都放在一个位置。”
Chu强调需要保持记录不仅要追溯到他目前的研究,而且还要涵盖所有以前的发现。
“这就像数据科学日记。每当遇到类似情况时,我都会保留良好的参考点,并请他们参考以指导下一步。”
有创造力
数据科学不仅涉及科学方法。职位可能会误导他人;您不必具有科学背景,但是您确实需要能够创造性地思考。通常,替代思维是您应对挑战的关键。
“我必须在解决问题的科学思维和创造性思维之间切换,以引导我探索新的不同探索途径。
“逻辑,科学的思维对于帮助我得出结论至关重要,但戴上创意帽同样重要:我使用好的和失败的例子作为观察新模式的线索。这全都与“编码情报”有关。”
学习编码
您需要扎实的编码能力,才能使用各种数据处理技术来预处理不同的数据源,以解决嘈杂或不完整的数据。
您还需要能够创建机器学习管道,这将需要您知道如何构建模型,并使用工具和框架来评估和分析其性能。
像大多数数据科学家一样,Chu使用Python,因为可以使用许多出色的软件包来处理和建模数据。
实际上,Glassdoor在2017年上半年为放置在其站点上的数据科学家抽取了10000个工作清单,并发现Python,R和SQL这三种特殊技能构成了数据科学中大多数职位空缺的基础。Ben Chu的团队依赖于开源机器学习包。
“我们主要将Confluence用作文档工具;机器学习的MLFlow,Amazon Sagemaker,Scikit-Learn,Tensorflow,PyTorch和BERT; Apache Spark在大型数据集上构建快速的数据管道;和Athena作为我们的数据库来存储处理后的数据。
“我们还使用Superset来连接数据并更轻松地构建仪表板以输出图表,从而使其更加直观。”
不用担心“冒名顶替综合症”
Chu现在是某企业的一名高级数据科学家,但是他长大后想成为一名音乐家,并且对语言着迷。“对于我在自然语言处理方面的工作领域,我需要对语言学,尤其是语义学和语言细微差别有很好的理解。”
他解释说,数据科学团队需要一系列技能-他和他的同事具有不同背景的重叠技能。
“您所需的技能将取决于您所从事的领域。例如,我需要对财务有很好的了解。
“例如,数据分析通过构建异常检测方法来检测欺诈行为,将其作为交易数据中的不规则模式来减轻欺诈行为。
“像我这样的数据科学家需要精通如何处理各种孤立的财务数据。知道要结合什么是至关重要的,因为没有这种理解,我就无法建立成功的模型。”
成为计算机科学家或数学家进入数据科学并不是必需的。没有人在每个领域都拥有全部专业知识。您可能来自法律,经济学或科学领域。这完全取决于您的想法。
如果您可以灵活,系统地进行操作,则可以在使用工具,框架和数据集的过程中熟悉它们。
如何开始
对于那些渴望发展其数据科学技能的人,Chu提供了一些实用的技巧,尽管COVID-19造成了干扰,您仍可以轻松地采用这些技巧。
您可以查找研究社区,参加网络研讨会并在线查找培训课程。一旦面对面的联网再次可行,Chu建议您积极参与数据科学界。
“参加聚会和黑客马拉松,这将帮助您建立一个强大的网络来讨论您的想法,激发您的研究并回答您的问题”。
另外,请记住,数据科学领域是新的并且仍在日趋成熟。
出现了各种不同的职位,例如数据科学家,数据工程师和数据分析师,以及机器学习和深度学习工程师。您可能会发现一个角色比另一个角色更适合您的兴趣和技能。
以上即是关于如何像数据科学家或数据分析师一样思考的全部内容,想了解更多关于数据科学的知识,请继续关注。