这是一个非常有趣的话题 http://cacm.acm.org/magazines/2009/7/32091-the-five-minute-rule-20-years-later/fulltext,他们使用以下公式来计算访问间隔时间:
BreakEvenIntervalinSeconds = (PagesPerMBofRAM / AccessesPerSecondPerDisk) × (PricePerDiskDrive / PricePerMBofRAM)。
它是使用缓冲池中保存页面的 RAM 成本公式得出的,每次需要页面时执行 I/O 的(部分)磁盘成本,使这两个成本相等,并求解访问之间的间隔的方程。
所以每次访问的磁盘 I/O 成本为每磁盘驱动器价格/每磁盘每秒访问次数,我的问题是为什么每次访问的磁盘 I/O 成本是这样计算的?
基本假设是磁盘寿命的限制是磁盘寻道次数,而 RAM 的大小成本是固定的,并且无论访问频率如何,其寿命都是固定的。这是合理的,因为寻找磁盘会导致物理磨损,当磁盘失效时,您会丢失整个磁盘。相比之下,RAM 没有物理移动部件,因此不会因使用而磨损。
根据该假设,将数据保存在磁盘上的成本取决于访问频率和磁盘成本。将数据保存在 RAM 中的成本取决于您使用的 RAM 量。他们试图找到将数据保存在磁盘上或内存中更便宜之间的盈亏平衡点。
However给出的方程是不完整的。虽然该方程确定了相关因素,但缺少一个重要的比例常数。硬盘平均可以承受多少次访问? RAM 平均可以使用多长时间?这些都涉及到在硬盘和内存上保存数据的成本,如果没有它们,你就相当于在比较苹果和橘子。
这代表了我对整篇论文的印象。它用很长的篇幅说了很多关于一个重要主题的内容,但分析很草率。他们草草了事,遗漏了关键的事情,并且没有做足够的事情来帮助人们理解他们的想法以及当他们的分析合适时你正在做什么。例如,如果您试图维护低延迟系统,则必须将所有数据保存在 RAM 中。时期。如果您正在处理大型数据集并且不想付费将其全部保存在 RAM 中,那么您将把数据流式传输到磁盘或从磁盘传输数据。如果您以冗余格式(例如 RAID)保存数据,则每次读取时执行的搜索次数比他们承认的要多。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)