Apache Druid 是一个分布式的、支持实时多维 OLAP 分析的数据处理系统,用于解决如何在大规模数据集下进行快速的、交互式的查询和分析的问题。
Apache Druid 具有以下特点:
Druid 最常用的场景就是大数据背景下、灵活快速的多维 OLAP 分析。另外,Druid 还有一个关键的特点,它支持根据时间戳对数据进行预聚合摄入和聚合分析。因此也有用户经常在有时序数据处理分析的场景中用到它,例如广告平台、实时指标监控、推荐模型、搜索模型。
Druid 是一个基于微服务的架构。Druid 中的每个核心服务均可以单独或联合部署在不同硬件上。
EMR 增强型 Druid
EMR Druid 基于 Apache Druid 做了大量的改进,包括与 EMR Hadoop 和云周边生态的集成、方便的监控与运维支持、易用的产品接口等,做到了即买即用和免运维。
EMR Druid 目前支持的特性如下所示:
本页内容是否解决了您的问题?