APACHE蜂巢

蜂巢是Apache为查询而构建的开源项目, 总结, 并使用类似sql的接口分析大型数据集. 它以其蜂巢查询语言将关系技术引入大数据处理而闻名, 以及可与关系数据库(如表)使用的结构和操作相媲美的结构和操作, 连接, 和分区.

Apache蜂巢特别适合分析具有复杂JOIN条件的大型数据集. 例如, batch SQL processing; exploratory queries on large volumes of data; queries that could be interrupted and need to be resumed, 等.

Apache蜂巢

想了解更多关于蜂巢和quhole的信息?

Apache hive on quhole

quole自2013年以来一直提供托管蜂巢服务, 蜂巢多版本,定时升级. HIve on quole从一开始就进行了云优化设计,并根据正在迁移到或已经部署了云数据湖的组织的需求进行了定制.

Qubole将开源社区的最新功能与Qubole的专有解决方案相结合,以提高性能, 降低成本, 改善用户体验, 简化行政和管理.

Apache蜂巢在quhole上的主要优势

快速实现价值

  • 指导您在几分钟内创建蜂巢集群
  • 通过ui、api和驱动程序访问数据的多个接口

成本效率

  • 与自我管理的基础设施相比,可减少高达50%的总体数据处理成本

提高性能的生产力

  • 策展表元数据管理
  • 使用云存储进行性能优化,以便更快地处理查询

企业级

  • 企业级安全
  • 与主流BI工具集成的JDBC/ODBC连接器

Apache蜂巢 on quole vs Apache蜂巢 开源

 

自动定量

Qubole开源
工作负载感知自动伸缩,用于适应工作负载的可变性和突发性
多个蜂巢Server2实例,以适应突发流量并增加服务的吞吐量.

 

性能

Qubole开源
直接写消除了云存储中较慢的文件复制操作
更快的云存储I/O
元数据缓存
自动收集和管理统计信息,以便更好地规划和执行查询

成本

Qubole开源
自动化集群生命周期管理
异构实例,以利用与其他实例族的价格差异, 同时保持集群的最高效率
当集群只有少量使用时,容器包装和积极缩小规模
对成本最优扩展的专门支持

安全性和合规性

Qubole开源
基于sql标准的蜂巢 Authorization和Apache Ranger支持
ACID事务支持
合规性(HIPAA, SOC2, ISO-27001)

资源

博客
蜂巢在quhole上的运行速度比蜂巢在AWS EMR上的运行速度快4倍
医生
蜂巢小抄单
友情链接: 1 2 3 4 5 6 7 8 9 10