HDFS/Hadoop默认数据块大小为64MB。磁盘中的块大小一般为4KB。
64MB 块大小意味着什么? ->是否意味着从磁盘读取的最小单位是64MB?
如果是,这样做的好处是什么?-> 方便连续访问 HDFS 中的大文件?
我们可以使用磁盘原始的 4KB 块大小来做同样的事情吗?
64MB 块大小意味着什么?
块大小是文件系统可以存储的最小数据单元。如果您存储 1k 或 60Mb 的文件,它将占用 1 个块。一旦跨越 64Mb 边界,您就需要第二个块。
如果是的话,这样做有什么好处?
HDFS 旨在处理大文件。假设您有一个 1000Mb 的文件。对于 4k 块大小,您必须发出 256,000 个请求才能获取该文件(每个块 1 个请求)。在 HDFS 中,这些请求通过网络传输并带来大量开销。每个请求都必须由名称节点处理,以确定在哪里可以找到该块。那是很多流量!如果使用 64Mb 块,请求数量将减少到 16,从而显着降低名称节点上的开销和负载成本。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)