使用Java API将Parquet格式写入HDFS,而无需使用Avro和MR

什么是简单的方式来写 到 通过(使用Java API) 一个POJO的,不使用

和 ?

我发现的样品已经过时,并且使用不推荐使用的方法,还使用了Avro,spark或MR之一。

回答:

实际上,没有外部框架的帮助,没有太多可用于读取/写入Apache Parquet文件的示例。

镶木地板库的核心是镶木地板列,您可以在其中找到一些直接读取/写入的测试文件:https :

//github.com/apache/parquet-mr/blob/master/parquet-column/src/test/java/org/

apache / parquet / io / TestColumnIO.java

更新:响应API弃用的部分:应将AvroWriteSupport替换为AvroParquetWriter,我检查ParquetWriter是否已弃用并且可以安全使用。

问候

以上是 使用Java API将Parquet格式写入HDFS,而无需使用Avro和MR 的全部内容, 来源链接: utcz.com/qa/427009.html

回到顶部