通过访问现有的蜂房在HBase的表中的行

有没有通过蜂巢访问现有的HBase的表记录的方式?

--------------解决方案-------------

是的,这是绝对有可能的.Infact蜂巢被大量用于,作为HBase的不提供SQL功能,如“连接”etc..Also蜂巢很容易让谁是新的NOSQL terminology..You用户只需要创建蜂巢表,提供与现有的HBase table..You映射应慎重,同时创造这mapping..Properly包括所有出现在HBase的tables..I想在这里补充一个重要的事情的事情。 。我们不应该认为蜂巢的作为替换HBASE的,因为它适合于批量处理而不是总实时应用。

按照蜂巢HBase的集成wiki页面,有可能使用create table命令类似如下:

CREATE TABLE hbase_table_1(key int, value string)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf1:val")
TBLPROPERTIES ("hbase.table.name" = "xyz");

但是,请记住,在蜂巢0.8和之前创建这样的表将只允许您从已通过您的相应蜂巢表插入您的HBase的表中访问数据。 如果你有不是通过蜂巢表格插入到表中的HBase预先存在的任何数据,您将无法通过蜂巢表来查询它的。

开始蜂巢0.9,JIRA 1634年,将可允许蜂巢访问表出现在HBase的表中的所有数据,无论它是如何插入它。

分类:HBase的 时间:2012-01-01 人气:0
本文关键词: HBase的,蜂房
分享到:

相关文章

  • 20亿行/月 - HBase的/蜂房/ Greenplum的/是什么? 2012-01-12

    我想用你的智慧为捡了一个数据仓库系统的解决方案. 这里有一些细节,以更好地理解这个问题: 数据组织在一个星型模式结构有一个大的事实,并〜15的尺寸. 每月20B实际上行 10尺寸与几百行(有点层次) 5个维度与数千行 2个维度,〜200K行 2个大尺寸带50M-100M行 运行针对该数据库的两个典型的查询 前成员dimq: select top X dimq, count(id) from fact where dim1 = x and dim2 = y and dim3 = z group b

  • 可以HBase的,MapReduce和HDFS可以在一台机器上工作,有Hadoop的安装,并在其上​​运行? 2014-12-13

    我工作的一个搜索引擎的设计,这是要在云环境中运行. 我们刚刚起步,有关于Hdoop没有太多的想法. 任何人都可以告诉我们,如果HBase的,MapReduce和HDFS可以在一台机器上工作,有Hdoop安装,并在其上​​运行? --------------解决方案------------- 是的,你可以. 你甚至可以创建一个虚拟机和一个单一的"计算机"上运行,它在那里(这是我:)). 关键是要简单地在"伪分布式模式",这是即使在Hadoop的快速入门的说明安装的Ha

  • 可以OLAP在BigTable的办呢? 2012-11-01

    在过去,我用来建立使用MySQL的运行OLAP多维数据集WebAnalytics. 现在OLAP多维数据集,我用它简直就是一个大表(好吧,这是存储比这一点更聪明)的方式,其中的每一行基本上是一种测量或和汇总组测量. 每个测量有一堆尺寸(即该页面名,用户代理,IP等)和一堆值(即有多少浏览量,有多少游客,等). 您运行在桌子上像这样的查询的形式(元SQL)的通常是: SELECT SUM(hits), SUM(bytes), FROM MyCube WHERE date='20090914' an

  • 蜂房HBase的整合 2013-02-01

    我试图蜂房和HBase的整合在一起. 对于我通过cwiki和其他一些博客和帖子去了,但不能做它.我现在用Hive-0.7.0和Hbase-0.90.4 . 可能有人向我提供的最低一些信息(且必须)的要求这样做呢? 我需要一个完全分布式HBase的设置才能使用蜂巢和HBase的在一起呢? 当我试图在独立模式下,我能够加入蜂房HBase的处理程序,但无法超越这一点. --------------解决方案------------- 什么样的错误是ü得到些什么? 正是没有ü安装哪一个? 配置非常(有人无

  • 对于Web分析Hadoop的蜂房HBase的忠告 2015-01-23

    我对工作的团队有幸能够管理,承认需要加强我们的技能和学习新技术. 其结果是,每当我们有重大项目之间的一个小的停机时间,我们正在鼓励利用这段时间来伸展我们的头脑了一下,学习新的东西. 我们经常处理大量的研究项目作为一个团队,让大家从知识中受益. 例如,我们建立了一个符合规范的Kerberos身份验证服务器来熟悉协议的来龙去脉. 我们写我们自己的网络服务器,了解有关网络应用效率的设计策略. 最近,我们一直很好奇的map-reduce,特别是Hadoop和各种支持组件(HBase的,HDFS,猪,蜂房

  • 如何使用HBase的和Hadoop服务实时路况信息,进行分析? (单集群VS独立的集群?) 2012-06-02

    我们的主要目的就是用的Hadoop做分析. 在这个用例中,我们做批量处理,所以吞吐量比延时更重要,这意味着HBase的并不一定是一个不错的选择(尽管越来越接近实时分析确实动听). 我们正在玩弄蜂房,我们喜欢它这么远. 虽然分析是我们希望在不久的将来使用Hadoop做的主要事情,我们也在寻找潜在的迁移我们对HBase的操作部件和服务实时路况出来. 这将存储有我们在我们的分析使用相同的数据,我想知道,如果我们可以只是为实时路况信息,分析一个系统的数据. 我已经阅读了大量的报道,似乎大多数组织选择有服

  • 如何配置单元比较HBase的? 2012-08-16

    我感兴趣的是找出如何在最近发布的(http://mirror.facebook.com/facebook/hive/hadoop-0.17/)蜂巢比较HBase的在性能方面. 采用蜂巢的类似SQL的接口是非常可取,我们已经实现了HBase的API. --------------解决方案------------- 这是很难找到很多关于蜂巢,但我发现这个片段在蜂房网站,严重倾斜有利于HBase的(粗体加)的: 配置单元基于Hadoop其是分批处理系统. 因此,该系统不会也不能保证在查询低延迟 . 该

  • 是用于存储和查询日志数据HBase的吧? 2012-12-30

    我想用HBase的存储日志(Web日志数据),每个日志将有大约20个不同的值(比方说列),我要运行的筛选结果基于这些列的查询. 我最初的想法是每个日志(小区)多次拯救这是在日志中每个字段的值的每个列下. 这会导致数据量大约增加了20倍,但我认为这给了良好的性能提高. 行键是时间戳的前缀是源标识. 每个源会产生(可能有几十来源千元)约40-100M日志行. 我还需要低延迟,可能低于10秒(所以像蜂巢解决方案目前不是一个选项) 你认为这是正确的模式设计? 如果不是你想的是正确的,也许我应该使用别的东

  • 阅读4表和写入1 HBase的表。 怎么样? 2013-03-31

    如何阅读4表和写入1 HBase的表在一个程序? 可能吗? 给我一些示例代码. --------------解决方案------------- 简短的回答是: 是的. 稍长的版本是: 依赖 . 我们知道旁边没有你的情况. 这使得它很难给出一个更有意义的答案. 我有一个运行,使用4个表,并将结果放进蜂箱蜂房查询Hadoop的工作. 我实现了这个确切的过程中3种不同的方式. 这是可能的......但没有足够的信息,你的情况是任何更多的帮助. 当寻求帮助,这是最好的,包括你正在考虑你做了什么或者什么让

Copyright (C) 55228885.com, All Rights Reserved.

55228885 版权所有 京ICP备15002868号

processed in 0.333 (s). 10 q(s)