一、要做大数据分析,需学什么?
虽然现在数据分析和大数据是很热门的两个方向,但是大数据分析方向还是很多,要看你想去哪个行业,比如说互联网、金融、零售、医学、生物等等,不同行业有不同的要求,有的偏于技术,有的偏于实务。
二、毕业之后想从事大数据方向的工作,要学习哪些知识
首先找好对口公司,然后回家学习,归纳工作的要点然后继续工作。
如果不合适我建议赶快换工作,工作是个你情我愿看前途的事,委屈并不一定能够换来前途。
不过我在网上看到过一个女的,骂他的男人请问你这也不干那也不干你想干哪行?这种类型属于空无大志,可是话虽如此,个人仍然有两种选择,委屈自己和改变工作,不论如何,能够解决问题的方法就是好方法,解决这个问题,又要考虑到外界因素,又要考虑到个人他本身的因素,所以也看个人价值观怎么样,我的话,当然是不会委曲求全的,但是任何事情都有多面性,我这样做未必好,别人委屈了也未必坏,具体情况还是按照现实情况来分别的。
三、大数据都需要什么技术
1、数据采集:ETL工具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
2、数据存取:关系数据库、NOSQL、SQL等。
3、基础架构:云存储、分布式文件存储等。
4、数据处理:自然语言处理(NLP,NaturalLanguageProcessing)是研究人与计算机交互的语言问题的一门学科。处理自然语言的关键是要让计算机理解自然语言,所以自然语言处理又叫做自然语言理解(NLU,NaturalLanguage Understanding),也称为计算语言学(Computational Linguistics。一方面它是语言信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。
5、统计分析:假设检验、显著性检验、差异分析、相关分析、T检验、方差分析、卡方分析、偏相关分析、距离分析、回归分析、简单回归分析、多元回归分析、逐步回归、回归预测与残差分析、岭回归、logistic回归分析、曲线估计、因子分析、聚类分析、主成分分析、因子分析、快速聚类法与聚类法、判别分析、对应分析、多元对应分析(最优尺度分析)、bootstrap技术等等。
6、数据挖掘:分类 (Classification)、估计(Estimation)、预测(Prediction)、相关性分组或关联规则(Affinity grouping or association rules)、聚类(Clustering)、描述和可视化、Description and Visualization)、复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)
7、模型预测:预测模型、机器学习、建模仿真。
8、结果呈现:云计算、标签云、关系图等。
四、0基础可以学大数据吗
0基础是可以学习大数据的,不过大数据学习有一定难度,要做好心理准备。
其次是学习大数据最好学历在大专及以上,不然学起来可能更困难,而且就算报班学习也需要半年左右的时间(我们是全日制安排上课,这样也需要半年),时间上相对其他类型的稍长,你要做好准备。
要学习大数据,你至少应该知道大数据是什么,大数据将被用在什么领域。通过对大数据的一般理解,你可以了解你是否对大数据感兴趣。如果你对大数据一无所知,你也可以学习,但学着学着你有可能不喜欢它了,这是浪费时间和精力,还可能是浪费金钱。所以,如果你想学习大数据,你需要对大数据有一个全面的了解。
五、数据分析需要掌握哪些知识?
首先,从知识体系的角度来看,当前学习数据分析需要学习三大块知识,其一是数学和统计学知识、其二是大数据知识、其三是行业知识。
数学和统计学是数据分析的基础,在大数据时代,要想在数据分析领域走得更远,一定要重视数学和统计学知识的学习。从某种程度上来说,数据分析就是构建在数学和统计学基础之上的,虽然当前有很多数据分析工具和平台可以使用,但是如果脱离数学和统计学知识,数据分析往往很难深入。对于数学基础比较薄弱的人来说,在学习数据分析的过程中,可以同时补学数学知识,包括线性代数和概率论等等。
数据分析是大数据技术体系的重要组成部分,实际上当前的数据分析也是大数据进行数据价值化的主要手段之一,所以当前学习数据分析一定不能脱离大数据技术体系。在大数据平台的支撑下,数据分析可以借助于大数据平台来达到一个更好的分析效果,比如速度提升就非常明显。
从数据分析的手段上来看,当前数据分析主要有两种方式,一种是统计学方式,另一种就是机器学习方式,当前机器学习的数据分析方式受到了广泛的关注,基于机器学习的数据分析未来也有广阔的发展和应用空间。采用机器学习进行数据分析,需要从算法设计开始入手,然后完成算法实现、算法训练、算法验证和算法应用等一系列环节。
最后,对于数据分析的初学者来说,可以从Python开始学起,然后进一步学习数据库、大数据平台和机器学习等内容,大数据平台可以考虑一下Hadoop和Spark。