Hadoop初学者 - 数据提取和分析

HDFS存储结构化的&非结构化数据。热线& IMPALA使我们能够编写SQL查询,然后将其转换为MapReduce。用户如何了解存储数据的模式或者如何根据存储的数据形成这些表格?Hadoop初学者 - 数据提取和分析

回答:

如果使用Parquet文件格式,则有用于直接检查文件块的工具。例如见this。大部分hadoop文件格式也有类似的方便工具,例如用于orcfiles的https://orc.apache.org/docs/tools.html。

以上是 Hadoop初学者 - 数据提取和分析 的全部内容, 来源链接: utcz.com/qa/262003.html

回到顶部