我查了一下,该管道中有一个 NER 模型。该 NER 模型是使用 TensorFlow 进行训练的,它有一些contrib
其中的代码仅兼容基于 Unix 的操作系统,例如 Linux 和 macOS。这里有一个悬而未决的问题:
https://github.com/tensorflow/tensorflow/issues/26468
为此,他们发布了一些兼容Windows被命名的管道noncontrib
。您可以将管道名称更改为以下内容:
val pipeline = PretrainedPipeline("explain_document_dl_noncontrib", lang = "en")
所有预训练管道的来源:https://nlp.johnsnowlabs.com/docs/en/pipelines
全面披露:我是 Spark NLP 库的贡献者之一。
UPDATE:自从 Spark NLP 发布以来2.4.0
,所有模型和管道现在都是跨平台的:https://github.com/JohnSnowLabs/spark-nlp-models
如果您使用 Spark NLP 2.4.0 版本,这应该适用于 Linux、macOS 和 Windows:
val pipeline = PretrainedPipeline("explain_document_dl", lang = "en")
2022 年更新:除了 M1 和 aarch64 架构(目前)外,所有 5000 多个模型/管道均兼容 Windows(8、10 和 11)、Linux(Ubuntu、Debian、CentOS 等)和 macOS 操作系统系统。
Spark NLP 模型中心:https://nlp.johnsnowlabs.com/models