Copyright © 2020-2024 Corporation. All rights reserved.深圳KAIYUN体育有限公司 版权所有
1、统计学相关知识 统计学是数据分析的基础,因为数据分析需要对大量数据进行统计分析,大家可以通过对统计学的学习,培养数据分析最基本的一些逻辑思维。 EXCEL 不要小看EXCEL,它可是最初级的数据分析工具,在处理的数据量不是很大时,EXCEL完全可以胜任。
2、自学:自学的话,成本低,但是时间长,而且对自身的要求更高一些。需要有很强的自制力和学习能力,另一方面,自学在项目实战这一块就比较缺乏。网课:看网课学习,和自己差不多,比较好点的就是有老师讲解知识点,但是学习的话还是要靠自觉。
3、总体来说,先学基础,再学理论,最后是工具 学习数据分析基础知识,包括概率论、数理统计 你的目标行业的相关理论知识。比如金融类的,要学习证券、银行、财务等各种知识。
4、技能二:掌握数据整理、可视化和报表制作。数据整理,是将原始数据转换成方便实用的格式,实用工具有DataWrangler和R。数据可视化,是创建和研究数据的视觉表现,实用工具有ggvis,D3,vega。数据报表是将数据分析和结果制作成报告。也是数据分析师的一个后续工作。这项技能是做数据分析师的主要技能。
紧密跟随社会发展:统计学的产生和发展都是为了满足社会管理与决策的需要,它的理论、方法和技术都与社会环境变化密切相关。据此,统计学的发展轨迹大致反映了人类社会发展的历程。
统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。
如多元统计分析、随机过程、非参数统计、时间序列分析等等。据美国学者估计,现代统计学是以指数式加速度发展的,新的研究分支不断增加,统计应用领域不断扩展。统计方法在各学科领域的应用又进一步促进了统计方法研究的深入和发展。
1、方法:需要理解主流机器学习算法的原理和应用。需要熟悉至少一门编程语言。需要理解数据库原理,能够熟练操作至少一种数据库。数据挖掘能力只能在项目实践的熔炉中提升、升华,所以跟着项目学挖掘是最有效的捷径。数据挖掘:又译为资料探勘、数据采矿。它是数据库知识发现中的一个步骤。
2、却也号称是数据挖掘;另一方面,国内真正规模化实施数据挖掘的行业是屈指可数(银行、保险公司、移动通讯),其他行业的应用就只能算是小规模的,比如很多大学都有些相关的挖掘课题、挖掘项目,但都比较分散,而且都是处于摸索阶段,但是我相信数据挖掘在中国一定是好的前景,因为这是历史发展的必然。
3、理论基础入门教材: 数据挖掘导论 java机器学习的库使用 Mahout in Action 用weka进行数据挖掘 数据挖掘实用机器学习技术 以上算是入门吧,java方面的。 python最好也要会,不过还是先把这三本看完+敲完,应该怎么学自己也就有思路了。
4、第一阶段:掌握数据挖掘的基本概念和方法。先对数据挖掘有一个概念的认识,并掌握基本的算法,如分类算法、聚类算法、协同过滤算法等。参考书:《数据挖掘概念和技术》(第三版)范明,孟小峰 译著。第二阶段:掌握大数据时代下的数据挖掘和分布式处理算法。