您当前的位置:首页 > 学习专区 > 数据库技术

大数据如何开始学习呢

时间:2017-04-11 09:33:43    作者:严老师

  热门的大数据已经吸引了很多人的眼球,主要就是日常的一些数据挖掘和数据分析之类的工作,这些听起来还是蛮简单的,但是如何开始呢?怎样才能学到一些有用的知识呢?下面就给大家指些明路吧!
  1、挖掘数据
  数据挖掘主要依赖于大部分机器学习算法,这些年因为深度学习算法的开发和无人驾驶汽车等应用的实习使得机器学习变得热门,但是机器学习是个很深奥的学科,专门学习这门课程的学校也不多。对于硕士生来说,如果学过最优化等,这样学起来就会比较容易,但本科生想要学好,就需要很扎实的概率论与数理统计的基础了。在这之前我看了很多这方面的书,觉得很难懂,后来我就有了疑惑,这个东西有那么重要么?我认为,如果不是博士,没必要把机器学习/深度学习学的很深。就像算法是很重要,但程序员没必要都像ACM队员那样练习算法。我们学习机器学习是为了使用他,而且基本的那几个算法已经开发的差不多了,我们最需要掌握的就是怎样使用它们,而且就那么几个算法,只有每个都用过几次就掌握了,所以我非常推荐边学边应用到实际,根据自己的兴趣,找点数据,看看能不能挖掘出什么有用的信息,这样也有成就感。这里我推荐一本书:《机器学习:实用案例解析》。同时,建议学习一门新的语言:R语言。如果不想学,那么用C,python也都是可以的。(超大规模数据是不能用R的)最后,我觉得这部分并不一定先开始学,也不用每一个算法都掌握十分熟悉,先熟练掌握一到两个。
  2Hadoop实战
  hadoop虽然只是一个软件,但是这个软件有很复杂的原理,我们要知道他是怎样把大数据分到好几个电脑上,知道MapReduce的原理。hadoop同时也是大数据的代名词,因为他为我们提供了一个平台,使得我们可以去处理超大的数据,至于怎么处理,处理后能得到什么,它不管。然后,就是怎样运作了。强烈建议大家自己安装好hadoop(要配置集群,自己剪虚拟机吧),然后在上面编点小程序练手。 Hadoop还有一个特点就是他有很多的附加服务,每个都有各自的功能,非常复杂,但是例如Hive,HBase等是非常重要的,也需要知道他们的工作原理,及使用方法。由于这部分大多是实战,学起来也不那么枯燥,所以我觉得这部分可以多用的点时间,把原理和方法都弄熟练,同时还要熟悉Linux环境,语言当然是JAVA。
  3数据库
  从字面意义上来看,大数据毕竟也是数据,肯定是离不开数据库的。有的人没有数据库的基础,不了解一个数据库的构造,不能熟悉使用sql语句,那肯定是学不好大数据的,所以大家一定要好好学习这些。即便大数据不热门了,数据库技术也会很重要的。
  如果你能做好以上三点,你的大数据就学的很好了,找工作也是很简单的一件事。但是挖掘数据这个工作,方法和技能很重要,然后理解也是非常重要的。挖掘信息之后还要思考,把数据转化为对公司有好处的观点。所以说,数据挖掘从来都不是简单的数据收集,更需要的是,有想法的人。

下一篇:学Oracle你需要知道的两个概念      上一篇:返回列表
推荐资讯
UI设计师
UI设计师
JAVA软件工程师课程
JAVA软件工程师课程
.NET软件工程师课程
.NET软件工程师课程
软件开发工程师课程
软件开发工程师课程
相关文章
栏目更新
栏目热门