Pinot实时分布式的OLAP数据存储和分析系统
Pinot 是一个实时分布式的 OLAP 数据存储和分析系统。LinkedIn 使用它实现低延迟可伸缩的实时分析。Pinot 从离线数据源(包括 Hadoop 和各类文件)和在线数据源(如 Kafka)中攫取数据进行分析。Pinot 被设计是可以进行水平扩展的。
Pinot 特别适合这样的数据分析场景:分析模型固定,数据只追加以及低延迟,以及分析结果可查询。
关键特性:
- 面向列的数据库,提供多种压缩模式,如运行长度、固定比特长度 
- 可插入式的索引技术,包括可排序索引、Bitmap 索引和反向索引 
- 可根据查询和段元数据对查询和执行进行优化 
- 近乎实时的从 Kafka 获取数据,以及批量从 Hadoop 获取数据 
- 类 SQL 的语言支持查询、聚合、过滤、分组、排序和去重 
- 支持多值字段 
- 水平伸缩以及容错 
Pinot 非常使用用来查询时许数据以及大维度的数组。
Pinot 的组件架构:

Pinot 核心概念:

示例查询:
/*Total number of documents in the table*/select count(*) from baseballStats limit 0/*Top 5 run scorers of all time*/ select sum('runs') from baseballStats group by playerName top 5 limit 0/*Top 5 run scorers of the year 2000*/select sum('runs') from baseballStats where yearID=2000 group by playerName top 5 limit 0/*Top 10 run scorers after 2000*/select sum('runs') from baseballStats where yearID>=2000 group by playerName limit 0/*Select playerName,runs,homeRuns for 10 records from the table and order them by yearID*/select playerName,runs,homeRuns from baseballStats order by yearID limit 1
关注公众号:拾黑(shiheibook)了解更多
赞助链接:
                        关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
                        四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
                        让资讯触达的更精准有趣:https://www.0xu.cn/
                    
 关注网络尖刀微信公众号
            关注网络尖刀微信公众号随时掌握互联网精彩
- 可让安卓手机运行ChromeOS:曝谷歌已放弃Ferrochrome项目!
- 港币对人民币汇率2024年9月29日
- 港币对人民币汇率2024年7月28日
- Dynamics 365 Field Service:为每位一线员工配备随身智能助手
- 韩元汇率对人民币2023年7月27日
- 加元兑换人民币汇率2023年6月12日
- Snap内部备忘录:制定60亿美元营收目标,未放弃AR长期愿景
- NukeSped“后门”重现:朝鲜黑客组织 Lazarus 利用 Log4j 漏洞攻击 VMware 服务器
- 阿里、美团都啃不下来的“硬骨头”,“中国版Sysco”的故事有多难讲?
- 美众议院议员联名致函商务部长,呼吁将荣耀加入实体清单
- 中欣晶圆启动12英寸硅片产能扩充计划
- 轻薄却很有“内涵”,OPPO A93全面评测



 微信扫码关注公众号
                            微信扫码关注公众号