剑客
关注科技互联网

标签:Parquet

技术教程

新型列式存储格式 Parquet 详解

阅读(70)评论(0)

Apache Parquet是Hadoop生态圈中一种 新型列式存储格式 ,它可以兼容Hadoop生态圈中大多数计算框架(Hadoop、Spark等),被多种查询引擎支持(Hive、Impala、Drill等),并且它是语言和平台无关的。P...

技术教程

Parquet与ORC:高性能列式存储格式

阅读(71)评论(0)

随着大数据时代的到来,越来越多的数据流向了Hadoop生态圈,同时对于能够快速的从TB甚至PB级别的数据中获取有价值的数据对于一个产品和公司来说更加重要,在Hadoop生态圈的快速发展过程中,涌现了一批开源的数据分析引擎,例如Hive、Sp...