企业空间 采购商城 存储论坛
  • hadoop是什么?怎么用hadoop?

    hadoop是什么?(1)Hadoop是一个开源的框架,可编写和运行分布式应用处理大规模数据,是专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式。Hadoop=HDFS(文件系统,数据存储技术相关)+ Mapreduc

    Hadoop部署2014-05-20
    Hadoop
  • Hadoop MapReduce两种常见的容错场景分析

    本文将分析Hadoop MapReduce(包括MRv1和MRv2)的两种常见的容错场景,第一种是,作业的某个任务阻塞了,长时间占用资源不释放,如何处理?另外一种是,作 业的Map Task全部运行完成后,在Reduce Task运行过程中,某个Map Tas

  • 刘刚:从互联网到传统行业 Hadoop发展迅猛!

    刘刚表示,目前Hadoop的应用正在从互联网行业到传统行业快速的扩张,但是在传统行业中Hadoop还是要面临很多困难:Hadoop的安全性不能满足他们的需求;Hadoop的人才缺少;怎么把传统的业务迁移到Hadoop平台上来处理。-什么原因吸引你钻研Had

    Hadoop实战2014-05-12
    Hadoop
  • 使用Apache Hadoop、Impala和MySQL进行数据分析

    Apache Hadoop是目前被大家广泛使用的数据分析平台,它可靠、高效、可伸缩。Percona公司的Alexander Rubin 最近发表了一篇博客文章介绍了他是如何将一个表从MySQL导出到Hadoop然后将数据加载到Cloudera Impala并在

    Hadoop教程2014-05-09
    Hadoop
  • 数据分析不使用Hadoop的五大理由

    作为Hadoop 曾经的超级粉丝,Joe Brightly承认自己在很多方面非常热爱Hadoop,比如“可以处理PB级别的数据;可以扩展到数千个处理大量计算工作的节点;可以用非常灵活的方式存储和加载数据……”

    Hadoop实战2014-05-09
    Hadoop
  • Hadoop全分布模式操作

    摘要:介绍Hadoop全分布模式操作,实现真正意义上的集群架构。关键词:Hadoop 全分布模式 文件配置利用Hadoop解决大数据问题时,我们是用全分布模式来操作Hadoop。如何基于全分布模式来操作Hadoop,构建Hadoop集群呢?具体步骤

    Hadoop2014-05-09
    Hadoop
  • 初学hadoop经历及使用Ambari快速部署Hadoop大数据环境介绍

    前言做大数据相关的后端开发工作一年多来,随着Hadoop社区的不断发展,也在不断尝试新的东西,本文着重来讲解下Ambari,这个新的Apache的项目,旨在让大家能够方便快速的配置和部署Hadoop生态圈相关的组件的环境,并提供维护和监控的功能.作为新

    Hadoop2014-05-09
    Hadoop
  • Hadoop日志到底存在哪里?

    初学者运行MapReduce作业时,经常会遇到各种错误,由于缺乏经验,往往不知所云,一般直接将终端打印的错误贴到搜索引擎上查找,以借鉴前人的经 验。然而,对于hadoop而言,当遇到错误时,第一时间应是查看日志,日志里通产会有详细的错误原因提示,本文将总结

    Hadoop安装2014-05-07
    Hadoop
  • 集群安装配置Hadoop详细图解

    集群安装配置Hadoop集群节点:node4、node5、node6、node7、node8。具体架构:操作系统为:CentOS release 5.5 (Final)安装步骤一、创建Hadoop用户组。二、安装JDK。下载安装jdk。安装

    Hadoop教程2014-05-07
    Hadoop
  • 优酷土豆单明辉—基于Hadoop平台下的视频推荐系统

    2008年于中科院声学所获博士学位,主导了优酷土豆视频推荐支撑平台设计与开发,目前负责低延时、高并发的大数据应用支撑平台建设。从视频网站的分类来说,优酷土豆属于两者兼备的模式(用户产生内容+专业视频内容)。而这两种类型的网站内容和用户行为各异,相

    Hadoop安装2014-05-07
    Hadoop
  • 大数据与Hadoop之间的关系

    个人汇总:hadoop :Hadoop是一个能够对大量数据进行分布式处理的软件框架,它是一种技术的实现大数据:资料:我们都听过这个预测:到2020年,电子数据存储量将在2009年的基础上增加44倍,达到35万亿GB。根据IDC数据显示,截止到2

    Hadoop安装2014-05-06
    Hadoop
  • 应该在什么时候使用Hadoop

    作者:chszs,转载需注明。博客主页:http://blog.csdn.net/chszs有人问我,“你在大数据和Hadoop方面有多少经验?”我告诉他们,我一直在使用Hadoop,但是我处理的数据集很少有大于几个TB的。他们

    Hadoop安装2014-05-05
    Hadoop
  • Hadoop技术一句话介绍

    Hadoop 是一种分布式系统的平台,通过它可以很轻松的搭建一个高效、高质量的分布系统,而且它还有许多其它的相关子项目,也就是对它的功能的极大扩充,包括Zookeeper,Hive,Hbase等。 MapReduce是Google提出的一种算法,用于超大型数

    Hadoop实战2014-05-05
    Hadoop
  • 4种常用压缩格式在Hadoop中的应用

    目前在Hadoop中用得比较多的有lzo,gzip,snappy,bzip2这4种压缩格式,笔者根据实践经验介绍一下这4种压缩格式的优缺点和应用场景,以便大家在实践中根据实际情况选择不同的压缩格式。1 gzip压缩优点:压缩率比较高,而且压缩/解压速度

    Hadoop实战2014-05-05
    Hadoop
  • 深度分析如何在Hadoop中控制Map的数量

    很多文档中描述,Mapper的数量在默认情况下不可直接控制干预,因为Mapper的数量由输入的大小和个数决定。在默认情况下,最终input占据了多少block,就应该启动多少个Mapper。如果输入的文件数量巨大,但是每个文件的size都小于HDFS的bloc

    Hadoop2014-05-04
    Hadoop
  • hadoop运行wordcount时的问题

    我搭建好hadoop计算平台之后。(我觉得应该搭建好了,jps命令后显示的进程也是对的)master上jps:slave2上jps:slave1上jps:但是在我运行wordcount之后老是报如下错误:虽然这是我运行hadoop fl -

    Hadoop实战2014-05-04
    Hadoop
  • Hadoop平台上Oozie调度系统的安装配置

    OOZIE是Hadoop平台上的开源调度工具,在项目中使用OOZIE将近一年时间了,OOZIE的安装配置还是挺复杂的。为了使用起来方便顺手,需要进行很多配置。下面整理了一下OOZIE安装配置的步骤,供使用Hadoop和OOZIE的童鞋们参考,也方便自己查看。

    Hadoop部署2014-05-04
    Hadoop
  • Hadoop中的一些基本操作

    先粗略说一下“hadoop fs”和“hadoop dfs”的区别:fs是各比较抽象的层面,在分布式环境中,fs就是dfs,但在本地环境中,fs是local file system,这个时候dfs不可用。1、列出

    Hadoop安装2014-04-30
    Hadoop
头条阅读
栏目热点
别人在看

Copyright @ 2006-2018 ChinaStor.COM 版权所有 京ICP备14047533号

中国存储网

存储第一站,存储门户,存储在线交流平台