UIMA 与 Spark

2023-12-21

正如中所述here https://spark-summit.org/2014/leveraging-uima-in-spark/UIMA 和 Spark 在分发基础设施方面有一些重叠。我本来打算将 UIMA 与 Spark 一起使用。 (现在我要转向UIMAFit)谁能告诉我当我们用spark开发uima时我们真正面临的问题是什么? 以及可能的遭遇是什么。 (抱歉,我没有对此做过任何研究。)


主要问题是访问对象,因为 UIMA 在运行分析引擎时尝试重新实例化对象。如果对象有本地引用,那么从远程 Spark 集群访问就会出现问题。某些 RDD 函数可能无法在 UIMA 上下文中工作。但是,如果您不使用单独的远程集群,那么就不会有问题。 (我说的是uima-fit 2.2)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

UIMA 与 Spark 的相关文章

随机推荐

  • 铸造和泛型,有性能差异吗?

    我最近经常在 Android 中编码 虽然我对 JAVA 很满意 但缺少一些 关于那里使用的核心概念的想法 我很想知道这两个代码之间是否存在性能差异 第一种方法 Specified as member variable ArrayList
  • javax 验证 api 不适用于 pojo 验证

    我有一个 POJO 类 其中类变量被注入 Value注解 我正在尝试使用 javax 验证 api 来验证我的类变量 所以我尝试过 NotNull NotEmpty and NotBlank 但即使 application yml 文件中存
  • Make 无法在 Alpine Linux 容器中以 root 身份运行 mkdir

    因此 我尝试在 Alpine Linux Docker 容器内构建 musl libc 配置脚本成功 但 make 立即停止 因为它无法运行 mkdir mkdir p lib make mkdir Operation not permit
  • 浏览器中的最大并行 HTTP 连接数?

    我正在创建一些与 HTTP 服务器的挂起连接 comet 反向 AJAX 等 它工作正常 但我看到浏览器只允许同时与给定域有两个挂起的连接 因此 如果用户在浏览器的 Tab1 中查看我的网站 然后又尝试在 Tab2 中加载它 他们就会用完与
  • 将精灵宽度缩放到屏幕宽度时出现问题

    实际上 我试图实现的目标与中所做的没有太大不同这个问题 https stackoverflow com questions 34768415 how to increase animate the width of the square o
  • 没有开发者模式/开发者许可证,无法旁加载 Win10 UWP 应用程序

    我正在开发一个要安装在多台 PC 上的业务线应用程序 但我无法成功完成侧载 我收到以下错误Add AppDevPackage script 无法获得开发者许可证 如果我设置开发者模式 我的问题就会消失 但是 这不是应用程序软件部署的选项 我
  • 在python中批处理非常大的文本文件

    我正在尝试将一个非常大的文本文件 大约 150 GB 批处理为几个较小的文本文件 大约 10 GB 我的一般流程是 iterate over file one line at a time accumulate batch as strin
  • Interop.Word Documents.Open 为空

    我正在尝试使用 Interop Word Application 打开 docx 文件并转换为 PDF 它作为控制台应用程序工作 但如果我在我的网络应用程序中使用相同的东西 它就不起作用 我尝试查看该文件夹的权限 我给予 网络服务 完全控制
  • 在 Java 中从字符串中解析对象

    我正在尝试编写一个通用方法来解析字符串中的对象 需要明确的是 我有以下不太优雅的实现 public static Object parseObjectFromString String s Class class throws Except
  • 我应该同步静态易失性变量吗?

    关于这个主题有几个问题 但大多数都回避了这个问题 因为这不是问题的意图 如果我的类中有一个静态易失性 private static volatile MyObj obj null 在下面的方法中我这样做 public MyObj getMy
  • RxJs:条件为真时缓冲事件,条件为假时传递事件

    我在下面创建了 Observable 构造函数 其工作原理如下 有谁知道是否有更简洁的方法使用 RxJ 附带的运算符来实现相同的行为 我在看缓冲区切换 http reactivex io rxjs class es6 Observable
  • 根据另一列中的 4 个值创建新列

    我想根据另一列中的 4 个值创建一个新列 if col1 1 then col2 G if col1 2 then col2 H if col1 3 then col2 J if col1 4 then col2 K 我如何在 R 中执行此
  • Raphaeljs 库和智能手机

    我使用了名为 worderfull 的 javascript 库拉斐尔伊斯 http raphaeljs com 在我的网站上绘制地图 动画和动画功能 我注意到使用这个库的脚本与iPhone但不与Android 有人可以确认这一点吗 只需进
  • 未定义的行为追溯是否意味着不能保证早期可见的副作用?

    在 C 中 如果我正确理解措辞 编译器可以假设不会发生 UB 从而影响将遇到 UB 但尚未遇到的执行路径中的行为 甚至是 I O 等可见的副作用 在抽象机遇到 UB 之前 C 是否需要 正确 执行程序直至最后可见的副作用 编译器似乎以这种方
  • 从源代码管理中排除在 Visual Studio 2013 中实际上不起作用?

    我已通过 文件 gt 源代码管理 gt 高级 gt 从源代码管理中排除 选项从 Visual Studio 2013 中的源代码管理中排除了某些文件 我看到我的目标文件旁边弹出一个小图标 上面写着 从源代码管理中排除 但是 每次对同一文件进
  • C# Visual Studio 单元测试,模拟客户端 IP 地址

    我正在编写一些单元测试 当尝试执行以下操作时 我的真实代码抛出了异常 string IPaddress HttpContext Current Request UserHostName ToString 有没有一种方法可以模拟 IP 地址
  • 在 PHP 中创建(日期,值)的数组/集合/列表

    我正在编写一个 PHP 脚本 其中输入为 From date To date 然后我想获取该日期范围并创建一个具有以下内容的某种数组 Array date x 当我将每个日期添加到数组中时 我将计算与之相关的值 对于 NET 我会 突然想到
  • iOS 应用程序提交中的导出合规性

    我制作了一个新应用程序并想提交到应用程序商店 但在最终提交时 有出口合规性检查 我应该检查什么是或否 我在我的应用程序中使用 https url 请帮我 提前致谢 当你知道你ARE符合导出要求 您可以将其放入您的 Info plist 中
  • 如何计算数字和数学运算符的数组(或字符串)

    我正在制作一个计算器 并将单击的所有数字和运算符推送 保存到数组和字符串中 我想知道哪个approach 在这种情况下是最好的 从输入生成字符串或数组OR我想不出更好的方法 我想计算数组或字符串 该字符串给出了错误的答案 我不知道如何计算数
  • UIMA 与 Spark

    正如中所述here https spark summit org 2014 leveraging uima in spark UIMA 和 Spark 在分发基础设施方面有一些重叠 我本来打算将 UIMA 与 Spark 一起使用 现在我要