如何在 Java 或 Python 中使用文件系统缓存？

2024-03-31

A 最近关于 Elasticsearch 的博客文章 http://www.elasticsearch.org/blog/elasticsearch-1-4-0-beta-released/网站正在谈论他们新的 1.4 beta 版本的功能。

我很好奇他们如何利用文件系统缓存：

最近的版本增加了对文档值的支持。本质上，文档值提供与内存中字段数据相同的功能，但它们在索引时写入磁盘。它们提供的好处是消耗很少的堆空间。文档值是从磁盘读取的，而不是从内存中读取的。虽然磁盘访问速度很慢，但文档值受益于内核的文件系统缓存。与 JVM 堆不同，文件系统缓存不受 32GB 限制。通过将字段数据从堆转移到文件系统缓存，您可以使用更小的堆，这意味着更快的垃圾收集，从而使节点更稳定。

在此版本之前，文档值明显慢于内存中的字段数据。此版本中的更改显着提高了性能，使其几乎与内存中的字段数据一样快。

这是否意味着我们可以操纵文件系统缓存的行为，而不是被动地等待操作系统的效果？如果是这样的话，我们在正常的应用程序开发中如何利用文件系统缓存呢？比如说，如果我正在编写 Python 或 Java 程序，我该怎么做呢？

文件系统缓存是与操作系统内部工作相关的实现细节，对最终用户来说是透明的。这不是需要调整或改变的事情。 Lucene 在管理索引段时已经使用了文件系统缓存。每次将某些内容索引到 Lucene（通过 Elasticsearch）时，这些文档都会写入段，这些段首先写入文件系统缓存，然后在一段时间后（当 translog（一种跟踪正在索引的文档的方式）被写入时）例如 full）缓存的内容被写入实际文件。但是，虽然要索引的文档位于文件系统缓存中，但仍然可以访问它们。

文档值实现的这种改进是指该功能现在能够使用文件系统缓存，因为它们是从磁盘读取、放入缓存并从那里访问的，而不是占用堆空间。

如何访问此文件系统缓存的描述见这篇优秀的博文 http://blog.thetaphi.de/2012/07/use-lucenes-mmapdirectory-on-64bit.html:

在我们之前的方法中，我们依靠使用系统调用在文件系统缓存和本地 Java 堆之间复制数据。直接访问文件系统缓存怎么样？这就是 mmap 的作用！

基本上 mmap 的作用与将 Lucene 索引处理为交换文件相同。 mmap() 系统调用告诉操作系统内核将我们的整个索引文件虚拟地映射到前面描述的虚拟地址空间中，并使它们看起来像我们的 Lucene 进程可用的 RAM。然后，我们可以访问磁盘上的索引文件，就像它是一个大型 byte[] 数组一样（在 Java 中，这是由 ByteBuffer 接口封装的，以使其可以安全地供 Java 代码使用）。如果我们从 Lucene 代码访问这个虚拟地址空间，我们不需要执行任何系统调用，处理器的 MMU 和 TLB 会为我们处理所有映射。如果数据仅在磁盘上，MMU 将引发中断，O/S 内核会将数据加载到文件系统缓存中。如果它已经在缓存中，则MMU/TLB将其直接映射到文件系统缓存中的物理内存。

我认为与Java程序中使用mmap的实际手段相关这是执行此操作的类和方法 http://docs.oracle.com/javase/7/docs/api/java/nio/channels/FileChannel.html#map%28java.nio.channels.FileChannel.MapMode,%20long,%20long%29.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Java 或 Python 中使用文件系统缓存？的相关文章

PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
纱线上的火花，连接到资源管理器 /0.0.0.0:8032

我正在我的开发机器 Mac 上编写 Spark 程序 hadoop的版本是2 6 spark的版本是1 6 2 hadoop集群有3个节点当然都在linux机器上我在idea IDE中以spark独立模式运行spark程序它运行成功
make_shared<>() 中的 WKWYL 优化是否会给某些多线程应用程序带来惩罚？

前几天我偶然看到这个非常有趣的演示 http channel9 msdn com Events GoingNative GoingNative 2012 STL11 Magic Secrets作者 Stephan T Lavavej 其中提
为什么在Python解释器中输入_会返回True？ [复制]

这个问题在这里已经有答案了我的翻译行为非常奇怪 gt gt gt True gt gt gt type True
Elasticsearch 无法写入日志文件

我想激活 elasticsearch 的日志当我运行 elasticsearch 二进制文件时我意识到我在日志记录方面遇到问题无法加载配置这是输出 sudo usr share elasticsearch bin elasticse
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
JUNIT 测试 void 方法

我有一个充满 void 方法的 java 类我想进行一些单元测试以获得最大的代码覆盖率例如我有这个方法 protected static void checkifValidElements int arg1 int arg2 metho
pygame：使用 sprite.RenderPlain 绘制精灵组的顺序

我有一个精灵组需要按一定的顺序绘制以便其精灵按应有的方式重叠然而即使使用运算符模块函数 sorted self sprites key attrgetter y x 对组进行排序顺序也是错误的我该如何解决这个问题直截了当地说
为正则表达式编写解析器

即使经过多年的编程我很羞愧地说我从未真正完全掌握正则表达式一般来说当问题需要正则表达式时我通常可以在一堆引用语法之后想出一个合适的正则表达式但我发现自己越来越频繁地使用这种技术所以自学并理解正则表达式properly 我决
为什么无法从 WEB-INF 文件夹内加载 POSModel 文件？

我在我的 Web 项目中使用 Spring MVC 我将模型文件放在 WEB INF 目录中 String taggerModelPath WEB INF lib en pos maxent bin String chunkerModelP
将字符串中的随机字符转换为大写

我尝试随机附加文本字符串这样就不只是有像这样的输出 gt gt gt david 我最终会得到类似的东西 gt gt gt DaViD gt gt gt dAviD 我现在的代码是这样的 import random import stri
使用 suds SOAP 库进行 HTTP 身份验证的奇怪行为

我有一个正在运行的 python 程序它使用 suds 通过 SOAP 获取大量数据 Web服务是通过分页功能实现的这样我就可以抓取nnn每个 fetch 调用的行并获取下一个nnn与后续的电话如果我使用如下代码向 HTTP 服务器进
根据多个阈值将 SciPy 分层树状图切割成簇

我想将 SciPy 的树状图切割成多个具有多个阈值的簇我尝试过使用 fcluster 但它只能削减一个阈值例如这是我从另一个问题中摘取的一段代码 import pandas data pandas DataFrame total ru
Android UnityPlayerActivity 操作栏

我正在构建一个 Android 应用程序其中包含 Unity 3d 交互体验我已将 Unity 项目导入 Android Studio 但启动时该 Activity 是全屏的并且不显示 Android 操作栏我怎样才能做到这一点整
使用 PC/SC 读卡器验证 Ultralight EV1

我在尝试使用 Java 中的 PC SC 读卡器特别是 ACR1222L 验证 Ultralight EV1 卡时遇到问题我能够使用 ISO 14443 3 标签的相应 APDU 在不受保护的标签上进行写入和读取但是我找不到运行 P
如何从 JavaFX 中的另一个控制器类访问 UI 元素？

我有一个使用 NetBeans 8 编写的 JavaFX Java 8 应用程序没有SceneBuilder 我的应用程序有一个主窗口该窗口有自己的 FXML 文件 primary fxml 和自己的控制器类 FXMLPrimaryCo
java.lang.IllegalStateException - 提交响应后无法创建会话

我在我的项目中使用 JSF PrimeFaces 我为此准备了一个Maven项目当我编译项目并加载主页后我收到以下异常 java lang IllegalStateException Cannot create a session af
在实现使用原始类型的接口时如何避免警告？

我正在实施流程工厂 http help eclipse org ganymede index jsp topic org eclipse platform doc isv reference api org eclipse debug co
如何建立与 FileZilla Server 1.2.0 的 FTPS 数据连接

使用 Apache commons net 的 Java FTPSClient 进行会话恢复是一个已知问题会话恢复是 FTPS 服务器数据连接所需的一项安全功能 Apache FTPSClient 不支持会话恢复并且 JDK API 使
Errors/BindingResult 参数应在模型属性、@RequestBody 或 @RequestPart 参数之后立即声明

我通过剖析示例应用程序来自学 Spring 然后到处添加代码来测试我在剖析过程中开发的理论在测试添加到 Spring 应用程序中的一些代码时我收到以下错误消息 An Errors BindingResult argument is ex

随机推荐

Flutter - 主动检查是否按下了特殊键（如 ctrl）

Question How to actively check if a certain decoration key is pressed like CTRL or SHIFT like if SomeKeyboardRelatedServ
在 Spring Boot 应用程序的生产中使用 Tomcat

作为 Spring Boot 的新手我需要了解以下内容因为我无法直接找到谷歌结果他们在现实生活中真正使用哪些应用程序服务器来部署这些 Spring Boot 应用程序 Tomcat 真的被公司使用吗如果是的话他们是通过集群来实现的
在 WCF 代理中实现 Ws 安全

我已将基于轴的 wsdl 导入到 VS 2008 项目中作为服务参考我需要能够传递安全详细信息例如用户名密码和随机数值来调用基于轴的服务我已经考虑过为 wse 做这件事我知道世界讨厌它那里没有问题我对 WCF 的经验很少但
如何更新StackPanel的布局？

问题是如果您单击按钮并展开电话号码堆栈面板和边框会展开这很好但如果您折叠它堆栈面板和边框不会折叠
使用 Robolectric 更改配置

为了在配置更改时保留 AsyncTasks 我使用基于片段的解决方案和 setRetainInstance true 它托管每个 AsyncTask 并回调侦听 Activity 类似于此解决方案http www androiddesign
Typescript 属性“property”在类型“void | ”上不存在样本

根据打字稿void is a 超类型 https www typescriptlang org docs handbook basic types html void of the null and undefined类型因此具有 vo
Silverlight 3.0 - 如何从 UserControl 访问 MainPage 控件值

我需要从 MainPage 检索一些控件值到 UserControl 在此 UserControl 中我需要能够获取 Frame ActualWidth 和 Frame ActualHeight 值在本例中 Frame 元素位于 Mai
如何在普通的非Android Java应用程序中使用NDK编译的JNI库？

我有一个 JNI 库供 Android 应用程序与 NDK 一起使用我没有源代码只是为某些拱门编译了 so 文件我想在 64 位 x86 Linux PC 上的简单控制台 Java 应用程序中调用该库中的函数我做了什么我从 x8
Google Spanner 中的 TrueTime API 是什么？

我多次尝试阅读该文档但未能理解它有人可以用通俗的语言解释一下吗 TrueTime 是 Google 提供的一个 API 可直接暴露时钟不确定性相比标准日期时间库 https docs python org 2 library date
如何取消使用锚标记放置的复选框的分组

我们在文档中使用 AnchorTags 将签名元素放入 PDF 文档中到目前为止诸如 SignHere 之类的签名元素已按预期工作每个签名只需单击一下即可正确放入文档中我们现在尝试使用 AnchorTags 将复选框添加到这些文档
使用 GORM 在 MySQL 中获取 NULL 日期时间值

我想获取最后一个 Visit details 行其 out time 为NULL使用戈尔姆 NIL本身是一种类型其中 VisitDetail OutTime 是mysql NullTime Code var visitDetail mo
使用 OR 条件左连接两个 R 数据框

Problem 我有两个数据框我想使用三个非数字变量的条件语句来连接它们这是我想要实现的伪代码版本 Join DF1 and DF2 on DF1 A DF2 A DF1 A DF2 B Dataset 这是创建两个数据框的一些代码 v
使用 PHP 更新 AD 密码的问题

您好我编写了以下脚本来更新特定用户的密码
Apache Flink - 作业内部无法识别自定义 java 选项

我已将以下行添加到 flink conf yaml 中 env java opts Ddy props path PATH TO PROPS FILE 启动 jobmanager jobmanager sh start cluster 时
编译器优化导致程序崩溃

我正在用 C Qt 编写一个程序其中包含图形文件解析器我用g 编译项目在开发过程中我不断比较有关优化和调试信息的不同编译器标志之间的低级解析器层的性能以及 Qt 的调试标志打开关闭 qDebug 和 Q ASSERT 现在我面
解析 NSURL mailto

如何解析 mailto 请求 mailto email protected cdn cgi l email protection email protected cdn cgi l email protection subject This
为什么 Python 将制表符视为 8 个空格？

使用 4 个空格的制表符宽度已成为编程中的主要选择那么为什么 Python 不将制表符视为 4 个空格而不是 8 个空格呢这个设计决定有技术历史其他原因吗感觉这可以让开发人员免于因缩进不一致而苦苦挣扎由于Linux控制台中默
使用请求方法登录Cypress

我注册并登录用户但是当在测试中导航到身份验证后面的页面时 Cypress 失败并将我带回登录页面从它的外观来看 before函数已成功执行由 API 日志验证这是我的代码 describe Dashboard page gt be
切换到相同数据类型的对象后，DataTemplate 不刷新

我有以下ControlTemplate
如何在 Java 或 Python 中使用文件系统缓存？

A 最近关于 Elasticsearch 的博客文章 http www elasticsearch org blog elasticsearch 1 4 0 beta released 网站正在谈论他们新的 1 4 beta 版本的功能我

如何在 Java 或 Python 中使用文件系统缓存？

如何在 Java 或 Python 中使用文件系统缓存？ 的相关文章

随机推荐

热门标签

如何在 Java 或 Python 中使用文件系统缓存？的相关文章