我试图使用命令hdfs dfs - du -h列出文件和文件夹的大小。我使用的命令是hdfs dfs - du -h /path_name/folder_name,返回的结果如下
9.2 G 27.5 G /path_name/folder_name/xxx01.parquet
0 0 /path_name/folder_name/xxx02.parquet
19.9 M 59.6 M /path_name/folder_name/xxx03.parquet我知道hadoop命令行从常规文件系统命令中借用了很多东西,而-du -h则列出了一个人类可读的文件夹/文件大小。然而,(以第一个结果行为例)这两个数字9.2 G 27.5 G的含义分别是什么?
谢谢!
发布于 2018-09-18 06:29:42
集群复制因子为3,第一个数字是文件的纯大小,第二个是带有repicas的文件大小。例如,实际文件大小为9.2GB。由于复制因子为3,所以带有副本的文件大小为27.5GB
size disk space consumed with all replicas full_pathhttps://stackoverflow.com/questions/52377747
复制相似问题