本周关注:Hadoop集群的规划、大数据的‘位置数据’、电商Hadoop实战、Alluxio及Hadoop、spark、hive之间的关系。
阿里云E-Mapreduce动态
1.4.1版本(已经发布)
- 完善失败报警
- 完善定时任务,增加小时、分钟定时任务
1.5.0版本 (正在研发)
1.6.0版本
资讯
所有的使用Hadoop或者打算使用Hadoop的公司肯定会遇到集群规划的问题,我到底使用多大的集群规模呢?有没有一个标准呢? 本篇文章就为你介绍集群规划。
如今,生物识别技术到处可见,指纹识别成了最新款智能手机的标配,DNA鉴定技术也已普及,脸部识别结果也越来越受人们信赖,还有很多生物识别技术潜伏在边缘地带。对于汽车防盗来说,有了大数据,车主就真的可以高枕无忧了吗
传统企业如何参与大数据?答案是 “位置大数据”吗,请看此文。
在Alluxio(前Tachyon)项目开源三年后的今天,全世界已经有超过300名贡献者参与到项目当中。仅仅在去年,它的代码贡献人数就比以往翻了三倍。Alluxio项目已经成为大数据领域内历史上成长最快的项目之
我们都知道Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。而如何将Hadoop生态系统应用到电商中呢?本文就为大家分享。
目标 了解E-MapReduce创建集群流程; 熟悉端口转发访问集群可视化组件zeppelin; 完成用zeppelin分析热播数据的示例。 创建集群 集群包括一组ecs实例和运行在实例上的分布式计算框架(Hadoop,Spark等),管控程序,是运行计算任务的资源基础。下面带大家熟悉创建
知乎上关于hadoop、hive、Spark之间关系的讨论