查看: 383|回复: 0
打印 上一主题 下一主题

尚学堂_肖斌_hadoop经典视频教程

[复制链接]

9万

主题

9万

帖子

28万

积分

管理员

管理员

Rank: 9Rank: 9Rank: 9

积分
289121
跳转到指定楼层
楼主
发表于 2017-9-24 01:54:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

尚书院_肖斌_hadoop典范视频教程
        Hadoop是一个可以对大量数据停止散布式处置的软件框架。 Hadoop 以一种牢靠、高效、可伸缩的方式停止数据处置。
      Hadoop 是牢靠的,由于它假定计较元素和存储会失利,是以它保护多个工作数据副本,确保可以针对失利的节点重新散布处置。
      Hadoop 是高效的,由于它以并行的方式工作,经过并行处置加速处置速度。
      Hadoop 还是可伸缩的,可以处置 PB 级数据。
      此外,Hadoop 依靠于社区办事,是以它的本钱比力低,任何人都可以利用。
      Hadoop是一个可以让用户轻松架构和利用的散布式计较平台。用户可以轻松地在         Hadoop上开辟和运转处置海量数据的利用法式。它首要有以下几个优点:

      高牢靠性。Hadoop按位存储和处置数据的才能值得人们相信。
      高扩大性。Hadoop是在可用的计较机集簇间分派数据并完成计较使命的,这些集簇可以方便地扩大到数以千计的节点中。
      高效性。Hadoop可以在节点之间静态地移动数据,并保证各个节点的静态平衡,是以处置速度很是快。
      高容错性。Hadoop可以自动保存数据的多个副本,而且可以自动将失利的使命重新分派。
      低本钱。与一体机、商用数据仓库以及QlikView、Yonghong Z-Suite等数据集市相比,hadoop是开源的,项目标软件本钱是以会大大下降。

      Hadoop带有用JAVA说话编写的框架,是以运转在 linux 生产平台上是很是理想的。
      Hadoop 上的利用法式也可以利用其他说话编写,比如 C++
      hadoop大数据处置的意义
Hadoop得以在大数据处置利用中普遍利用得益于其本身在数据提取、变形和加载(ETL)方面上的自然上风。Hadoop的散布式架构,将大数据处置引擎尽能够的靠近存储,对例如像ETL这样的批处置操纵相对合适,由于类似这样操纵的批处置成果可以间接走向存储。Hadoop的MapReduce功用实现了将单个使命打坏,并将碎片使命(Map)发送到多个节点上,以后再以单个数据集的形式加载(Reduce)到数据仓库里。
游客,如果您要查看本帖隐藏内容请回复

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|IT视频教程资源网

GMT+8, 2024-11-13 14:33 , Processed in 0.155386 second(s), 22 queries .

快速回复 返回顶部 返回列表

客服
热线

微信
7*24小时微信 客服服务

扫码添
加微信

添加客服微信获取更多

关注
公众号

关注微信公众号