- 北有云溪
-
数据分析师要学会Excel、掌握SQL Server或者Oracle的SQL语句、掌握可视化工具。
首先是Excel,貌似这个很简单,其实未必。Excel不仅能够做简单二维表、复杂嵌套表,能画折线图、Column chart、Bar chart、Area chart、饼图、雷达图、Combo char、散点图、Win Loss图等,而且能实现更高级的功能。
包括透视表(类似于BI的多维分析模型Cube),以及Vlookup等复杂函数,处理100万条以内的数据没有大问题。最后,很多更高级的工具都有Excel插件,例如一些AI Machine Learning的开发工具。
掌握SQL Server或者Oracle的SQL语句,虽然你是业务分析师,但如果取数据能少依赖于IT人员和IT工具(比如BI的多维分析模型,有时候并不能获取你想要的数据),对于做业务分析,无疑是如虎添翼,我曾经见过华为的会计能写七层嵌套的SQL语句,很吃惊。
包括join、group by、order by、distinct、sum、count、average,各种统计函数等。
掌握可视化工具,比如BI,如Cognos、Tableau、FineBI等,具体看企业用什么工具,像我之前用的是FineBI。
这些工具做可视化非常方便,特别是分析报告能含这些图,一定会吸引高层领导的眼球,一目了然了解,洞察业务的本质。另外,作为专业的分析师,用多维分析模型Cube能够方便地自定义报表,效率大大提升。
- nicehost
-
要熟练使用 Excel、至少熟悉并精通一种数据挖掘工具和语言、撰写报告的能力、要打好扎实的 SQL 基础。
1、要熟练使用 Excel
Excel 可以进行各种数据的处理、统计分析和辅助决策操作,作为常用的数据处理和展现工具,数据分析师除了要熟练将数据用 Excel 中的图表展现出来,还需要掌握为生成的图表做一系 列的格式设置的方法。
2、至少熟悉并精通一种数据挖掘工具和语言
以R语言为例,R编程语言在数据分析与机器学习领域已经成为一款重要的工具。R 作为脚本语言凭借其良好的互动性和丰富的扩展包资源可以方便地解决大部分数据处理、变换、统计分析、可视化的问题,并可以重现所有的细节。
3、撰写报告的能力
在撰写报告时,深入地思考,深入分析,逻辑严谨,结论有说服力,能提前预测数据趋 势,能从问题中引申出解决方案,提出有指导意义的分析建议,这些都是一名优秀的分析师所体现的特质。
4、要打好扎实的 SQL 基础
SQL 基础之所以重要,是因为数据分析师分析的数据大多都是从数据库中提取而来的。有良好的 SQL 功底并能熟悉使用,不仅能提取到需要的数据,还能大大提高工作效率。
注意:
1、与传统的数据分析师相比,互联网时代的数据分析师面临的不是数据匮乏,而是数据过剩。因此,互联网时代的数据分析师必须学会借助技术手段进行高效的数据处理。更为重要的是,互联网时代的数据分析师要不断在数据研究的方法论方面进行创新和突破。
2、就行业而言,数据分析师的价值与此类似。就新闻出版行业而言,无论在任何时代,媒体运营者能否准确、详细和及时地了解受众状况和变化趋势,都是媒体成败的关键。
- 阿啵呲嘚
-
1、Excel
作为数据分析师,Excel是必备技能。Excel 是经过检验的可靠的数据分析工具,它广泛存在,非程序人员也能便捷操作,所以大多数企业即使也使用其他工具,但 Excel 工具还是他们的不二选择。
2、统计学
统计学同样是数据分析师的必备技能之一,你只有学好了统计学才能谈得上数据分析。统计知识会要求我们以另一个角度看待数据。当你知道AB两组的差异用平均值看是多傻的事情,你的分析技巧也会显著提高。如果你想成为一名出色的数据分析师,那么你就必须要会统计学。
3、SQL
sql是所有数据库查询的语言,sql非常容易入手。针对不同的数据库,如mysql、sqlserver、oracle等,sql语法会有所不同,但是总体上大同小异,只是细微处的差别。而且如果你有数据库基础的话,只需要找些sql查询的习题来做一下,就会很快的得到提高。
4、行业知识
对于数据分析师来说,业务的了解比数据方法论更重要。而且业务学习没有捷径。这一部分也没有什么书可以看的了,基本都靠搜索,总结,思考,再搜索,总结,思考。
- 贝贝
-
数据分析师要学会数据分析思维、编代码、懂数据库、统计、数据、机器学习等技能。
1、数据分析思维
作为一名数据科学家需要很挑剔,并且善于发现他人会遗漏的东西。那么我们应该如何做到像数据科学家一样思考呢?梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标(各类分析指标需合理搭配使用)。同时,确保分析框架的体系化和逻辑性。
2、编代码
如果希望拥有专业水准的话,从编程基础到端到端的开发,一些技术的语言,比如R、Python、和一些商业软件的SAS、SPSS等,以及深入的交互式学习,这些你至少精通几门,其他懂一些最好。
3、懂数据库
数据分析大多应用实际。企业数据常常被保存在MySQL、Oracle、Postgres、MonogoDB、Cassandra等数据库中,所以这些数据库你要了解甚至懂。
4、统计、数据、机器学习
关于数学知识,大学课堂会学过一部分,如果是数学科学类的专业会学得更精深。如果这一部分你需要弥补一下充充电,可汗学院、麻省理工都有相关的开放课程。关于统计学知识,推荐去udacity,openintro上系统的学习,统计还是需要一定思维的锻炼的。
- 再也不做稀饭了
-
数据分析师要学:数学知识、分析工具、编程语言。
1、数学知识
数学知识是数据分析师的基础知识。对于初级数据分析师,了解一些描述统计相关的基础内容,有一定的公式计算能力即可,了解常用统计模型算法则是加分。
对于高级数据分析师,统计模型相关知识是必备能力,线性代数(主要是矩阵计算相关知识)最好也有一定的了解。而对于数据挖掘工程师,除了统计学以外,各类算法也需要熟练使用,对数学的要求是最高的。
2、分析工具
对于初级数据分析师,玩转Excel是必须的,数据透视表和公式使用必须熟练,VBA是加分。另外,还要学会一个统计分析工具,SPSS作为入门是比较好的。
对于高级数据分析师,使用分析工具是核心能力,VBA基本必备,SPSS/SAS/R至少要熟练使用其中之一,其他分析工具(如Matlab)视情况而定。
3、编程语言
对于初级数据分析师,会写SQL查询,有需要的话写写Hadoop和Hive查询,基本就OK了。对于高级数据分析师,除了SQL以外,学习Python是很有必要的,用来获取和处理数据都是事半功倍。当然其他编程语言也是可以的。
- CarieVinne
-
数据分析师要学会的技能有以下几点:
1、知识体系
统计学的基本知识和对machine learning的了解:大部分对消费者的分析都离不开描述统计方法(平均数,中位数,显著性等等)
2、计算机软件
对于数据分析师来说,可能每个项目的70%到80%的时间都是在收集和处理数据,他们需要首先想好需要什么样的数据,比如timeframe是一年还是十年。选定好需要的数据后要进入一个或多个数据库去收集数据,最后需要对数据进行一些处理,看看是不是有missing value或者outliers等等。
3、明确问题(Defining the Problem)
将分析范围缩小是很重要的技能。如何将复杂的问题去掉细枝末节,抓住重点需要良好的沟通能力和对商业需求的充分理解能力。注意:避免向客户递交太多对解决核心问题无用的信息。另外,对公司和行业的了解也会使得这个过程更加得心应手。
4、了解听众(Knowing the Audience)
通常来说一个数据分析师需要面对PM和CEO。因此,在准备presentation时,要注意回答这两方关心的不同的问题。对于PM来说,需要的是简单无修饰,多干货介绍在各种情况下如何进行协作交互。而面对CEO,需要展示的是稍加修饰的PPT和最重要提供具体的建议。
- max笔记
-
要学会的技能:
1、懂业务。从事数据分析工作的前提就会需要懂业务,即熟悉行业知识、公司业务及流程,最好有自己独到的见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的使用价值。
2、懂管理。一方面是搭建数据分析框架的要求,比如确定分析思路就需要用到营销、管理等理论知识来指导,如果不熟悉管理理论,就很难搭建数据分析的框架,后续的数据分析也很难进行。另一方面的作用是针对数据分析结论提出有指导意义的分析建议。
3、懂分析。指掌握数据分析基本原理与一些有效的数据分析方法,并能灵活运用到实践工作中,以便有效的开展数据分析。
在学习的过程中应该注意以下事项:
要想快速成为数据分析师,则可以从计算机知识开始学起,具体点就是从数据分析工具开始学起,然后在学习工具使用的过程中,辅助算法以及行业知识的学习。
学习数据分析工具往往从Excel工具开始学起,Excel是目前职场人比较常用的数据分析工具,通常在面对10万条以内的结构化数据时,Excel还是能够胜任的。对于大部分职场人来说,掌握Excel的数据分析功能能够应付大部分常见的数据分析场景。
在掌握Excel之后,接下来就应该进一步学习数据库的相关知识了,可以从关系型数据库开始学起,重点在于Sql语言。掌握数据库之后,数据分析能力会有一个较大幅度的提升,能够分析的数据量也会有明显的提升。
如果采用数据库和BI工具进行结合,那么数据分析的结果会更加丰富,同时也会有一个比较直观的呈现界面。
数据分析的最后一步就需要学习编程语言了,目前学习Python语言是个不错的选择,Python语言在大数据分析领域有比较广泛的使用,而且Python语言自身比较简单易学,即使没有编程基础的人也能够学得会。
通过Python来采用机器学习的方式实现数据分析是当前比较流行的数据分析方式。
- LuckySXyd
-
数据分析师要学:
1,业务。
从事数据分析工作的前提就会需要懂业务,即熟悉行业知识、公司业务及流程,最好有自己独到的见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的使用价值。
2、管理。
一方面是搭建数据分析框架的要求,比如确定分析思路就需要用到营销、管理等理论知识来指导,如果不熟悉管理理论,就很难搭建数据分析的框架,后续的数据分析也很难进行。另一方面的作用是针对数据分析结论提出有指导意义的分析建议。
3、分析。
指掌握数据分析基本原理与一些有效的数据分析方法,并能灵活运用到实践工作中,以便有效的开展数据分析。基本的分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等。高级的分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等。
4、工具。
指掌握数据分析相关的常用工具。数据分析方法是理论,而数据分析工具就是实现数据分析方法理论的工具,面对越来越庞大的数据,我们不能依靠计算器进行分析,必须依靠强大的数据分析工具帮我们完成数据分析工作。
5、设计。
懂设计是指运用图表有效表达数据分析师的分析观点,使分析结果一目了然。图表的设计是门大学问,如图形的选择、版式的设计、颜色的搭配等等,都需要掌握一定的设计原则。
- ardim
-
数据分析师要学:SQL、Python语言、R语言、概率论及统计学知识。
1、SQL
结构化查询语言,简称SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统,同时也是数据库脚本文件的扩展名,结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作,结构化查询语言语句可以嵌套,这使它具有极大的灵活性和强大的功能。
2、Python语言
Python是一种计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。
3、R语言
R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具,R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。
4、概率论
概率论,是研究随机现象数量规律的数学分支。随机现象是相对于决定性现象而言的,在一定条件下必然发生某一结果的现象称为决定性现象。例如在标准大气压下,纯水加热到100℃时水必然会沸腾等。随机现象则是指在基本条件不变的情况下,每一次试验或观察前,不能肯定会出现哪种结果,呈现出偶然性。
- 蓓蓓
-
互联网本身具有数字化和互动性的特征,这种属性特征给数据搜集、整理、研究带来了革命性的突破。以往“原子世界”中数据分析师要花较高的成本(资金、资源和时间)获取支撑研究、分析的数据,数据的丰富性、全面性、连续性和及时性都比互联网时代差很多。
与传统的数据分析师相比,互联网时代的数据分析师面临的不是数据匮乏,而是数据过剩。因此,互联网时代的数据分析师必须学会借助技术手段进行高效的数据处理。更为重要的是,互联网时代的数据分析师要不断在数据研究的方法论方面进行创新和突破。
从事数据分析工作的前提就会需要懂业务,即熟悉行业知识、公司业务及流程,最好有自己独到的见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的使用价值。
一方面是搭建数据分析框架的要求,比如确定分析思路就需要用到营销、管理等理论知识来指导,如果不熟悉管理理论,就很难搭建数据分析的框架,后续的数据分析也很难进行。
- gitcloud
-
数据分析师要学数学、统计技能、机器学习的概念、代码、数据库、数据池及分布式存储、数据修改和数据清洗技术等等。
数学和统计技能。一个好的数据科学家必须能够理解数据告诉你的内容,做到这一点,你必须有扎实的基本线性代数,对算法和统计技能的理解。在某些特定场合可能需要高等数学,但这是一个好的开始场合。
了解机器学习的概念。机器学习是下一个新兴词,却和大数据有着千丝万缕的联系。机器学习使用人工智能算法将数据转化为价值,并且无需显式编程。
学习代码。数据科学家必须知道如何调整代码,以便告诉计算机如何分析数据。从一个开放源码的语言如python那里开始吧。
了解数据库、数据池及分布式存储。数据存储在数据库、数据池或整个分布式网络中。以及如何建设这些数据的存储库取决于你如何访问、使用、并分析这些数据。如果当你建设你的数据存储时没有整体架构或者超前规划,那后续对你的影响将十分深远。
学习数据修改和数据清洗技术。数据修改是将原始数据到另一种更容易访问和分析的格式。数据清理有助于消除重复和“坏”数据。两者都是数据科学家工具箱中的必备工具。
了解良好的数据可视化和报告的基本知识。你不必成为一个平面设计师,但你确实需要深谙如何创建数据报告,便于外行的人比如你的经理或CEO可以理解。
添加更多的工具到您的工具箱。一旦你掌握了以上技巧,是时候扩大你的数据科学工具箱了,包括Hadoop、R语言和Spark。这些工具的使用经验和知识将让你处于大量数据科学求职者之上。
练习。在你在新的领域有一个工作之前,你如何练习成为数据科学家?使用开源代码开发一个你喜欢的项目、参加比赛、成为网络工作数据科学家、参加训练营、志愿者或实习生。最好的数据科学家在数据领域将拥有经验和直觉,能够展示自己的作品,以成为应聘者。
- 豆豆staR
-
1、R语言也好,Python语言也好,学习一门新的编程语言
我曾见到有同学同时学习R语言和Python语言,最后落得两手空空。这种做法是很致命的。你一定要沉下心来专攻一门。
鉴于这两种语言都是开放源代码工具,所以在公司里都有广泛运用。Python被公认为最简单的编程语言,而R语言一直都是最受青睐的统计工具。学习哪一门的决定权在你,因为两个同等出色。
推荐课程:学习Codecademy上的Python语言课程;学习DataCamp上的R语言课程。
PS:推荐R语言和Python入门课程《Python入门:数据挖掘实战》、《R语言入门》。
2、学习统计学和数学
统计学的内容全都是关于假设和数列,然而没有统计学和数学的知识你很难深入到数据行业里,这是数据科学家的重中之重。
如果你不擅长数学,那现在是时候走出困境了。面对深奥的统计、几何和概率领域知识时,一定不要惊慌。可汗学院(Khan Academy)、Udacity等站点上都有很多优质的统计学课程。下载APP,现在就能开始学习。
推荐课程:Udacity上的推论统计学和描述统计学课程;可汗学院(Khan Academy)上的几何课程。
- tt白
-
数据分析师要学会数据分析思维、编代码、懂数据库、统计、数据、等技能,还要懂业务、懂管理等。而且作为数据分析师,Excel是必备技能。个人以为要成为一名优秀的数据分析师,除了应具备专业知识外,成熟的人格、宽泛的视野也是必须要具备的。