蜂巢是Apache为查询而构建的开源项目, 总结, 并使用类似sql的接口分析大型数据集. 它以其蜂巢查询语言将关系技术引入大数据处理而闻名, 以及可与关系数据库(如表)使用的结构和操作相媲美的结构和操作, 连接, 和分区.
Apache蜂巢特别适合分析具有复杂JOIN条件的大型数据集. 例如, batch SQL processing; exploratory queries on large volumes of data; queries that could be interrupted and need to be resumed, 等.
quole自2013年以来一直提供托管蜂巢服务, 蜂巢多版本,定时升级. HIve on quole从一开始就进行了云优化设计,并根据正在迁移到或已经部署了云数据湖的组织的需求进行了定制.
Qubole将开源社区的最新功能与Qubole的专有解决方案相结合,以提高性能, 降低成本, 改善用户体验, 简化行政和管理.
Qubole | 开源 | |
工作负载感知自动伸缩,用于适应工作负载的可变性和突发性 | ![]() | ![]() |
多个蜂巢Server2实例,以适应突发流量并增加服务的吞吐量. | ![]() | ![]() |
Qubole | 开源 | |
直接写消除了云存储中较慢的文件复制操作 | ![]() | ![]() |
更快的云存储I/O | ![]() | ![]() |
元数据缓存 | ![]() | ![]() |
自动收集和管理统计信息,以便更好地规划和执行查询 | ![]() | ![]() |
Qubole | 开源 | |
自动化集群生命周期管理 | ![]() | ![]() |
异构实例,以利用与其他实例族的价格差异, 同时保持集群的最高效率 | ![]() | ![]() |
当集群只有少量使用时,容器包装和积极缩小规模 | ![]() | ![]() |
对成本最优扩展的专门支持 | ![]() | ![]() |
Qubole | 开源 | |
基于sql标准的蜂巢 Authorization和Apache Ranger支持 | ![]() | ![]() |
ACID事务支持 | ![]() | ![]() |
合规性(HIPAA, SOC2, ISO-27001) | ![]() | ![]() |
免费访问quhole 30天,以建立数据管道, 将机器学习应用到生产中, 并分析来自任何数据源的任何数据类型.