使用Java API将Parquet格式写入HDFS,而无需使用Avro和MR
什么是简单的方式来写 到 通过(使用Java API) 一个POJO的,不使用
和 ?
我发现的样品已经过时,并且使用不推荐使用的方法,还使用了Avro,spark或MR之一。
回答:
实际上,没有外部框架的帮助,没有太多可用于读取/写入Apache Parquet文件的示例。
镶木地板库的核心是镶木地板列,您可以在其中找到一些直接读取/写入的测试文件:https :
//github.com/apache/parquet-mr/blob/master/parquet-column/src/test/java/org/
apache / parquet / io / TestColumnIO.java
更新:响应API弃用的部分:应将AvroWriteSupport替换为AvroParquetWriter,我检查ParquetWriter是否已弃用并且可以安全使用。
问候
以上是 使用Java API将Parquet格式写入HDFS,而无需使用Avro和MR 的全部内容, 来源链接: utcz.com/qa/427009.html