博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop简介
阅读量:5101 次
发布时间:2019-06-13

本文共 608 字,大约阅读时间需要 2 分钟。

1:什么是hadoop

分布式存储和分布式运算的软件平台。Apache Hadoop 是一个用java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,它可以让应用程序支持上千个节点和PB级别的数据。Hadoop是从google的MapReduce和Google文件系统的论文获得的灵感。

 

 

2:hadoop特点

hadoop有三个子项目:Hadoop core,HBase, Zookeeper.hadoop core提供分布式文件系统HDFS,支持MapReduce分布式计算。Hadoop框架中最核心的设计就是MapReduce和HDFS。MapReduce的思想是由Google的一篇论文所提及而被广为流传,简单的一句话:MapReduce就是任务的分解与结果的汇总。HDFS是hadoop分布式文件系统的缩写,为分布式计算提供底层支持。HBase类似Google的BigTable,是hadoop的数据库。HBase使用和BigTable非常相同的数据类型。用户存储数据行在一个表里,其中一个数据行拥有一个可选择的键和任意数量的列。表是疏松存储的,因此用户可以给行定义各种不同的列。Zookeeper高可用和具有可靠的协调机制,分布式应用使用它来存储和协调。具有高效和可靠的协同工作系统

 

 

 

转载于:https://www.cnblogs.com/xiaoit/p/3393202.html

你可能感兴趣的文章
Laravel 日志权限问题
查看>>
Laravel Carbon获取 某个时间后N个月的时间
查看>>
Laravel 指定日志生成目录
查看>>
layui 表格点击图片放大
查看>>
there is no permission with id `12`
查看>>
Laravel使用EasyWechat 进行微信支付
查看>>
我的大二学年总结
查看>>
oracle 基本语法,正则表达式应用
查看>>
Socket通信原理
查看>>
http请求被挂起 cancled 原因
查看>>
刷题——移动盒子及其相关题目
查看>>
docker容器
查看>>
kafka的docker文件
查看>>
java的线程池的基础类
查看>>
docker的源配置
查看>>
Linux的IO机制
查看>>
leetcode大纲
查看>>
TCP的机制
查看>>
Linux的内核性能参数的调整
查看>>
WEB SERVER调优
查看>>