如何在Python中使用多处理来加速循环执行

2024-05-11

我有两个清单。列表 A 包含 500 个单词。列表 B 包含 10000 个单词。我正在尝试为列表 A 找到与 B 相关的相似单词。我正在使用 Spacy 的相似函数。

我面临的问题是计算需要很长时间。我是多处理使用的新手，因此请求帮助。

如何通过Python中的多处理来加速for循环部分的执行？

以下是我的代码。

ListA =['Dell', 'GPU',......] #500 words lists
ListB = ['Docker','Ec2'.......] #10000 words lists
s_words = []
for token1 in ListB:
    list_to_sort = [] 
    for token2 in ListA:    
        list_to_sort.append((token1, token2,nlp(str(token1)).similarity(nlp(str(token2)))))
        sorted_list = sorted(list_to_sort, key = itemgetter(2), reverse=True)[0][:2]
        s_words.append(sorted_list)

您可以使用多重处理 https://docs.python.org/2/library/multiprocessing.html包裹。我希望这会大大减少您的时间。看here https://github.com/explosion/spaCy/issues/1572获取示例代码。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

parallelprocessing

NLP

pythonmultiprocessing

spacy

如何在Python中使用多处理来加速循环执行的相关文章

Huggingface 变形金刚模块未被 anaconda 识别

我正在使用 Anaconda python 3 7 Windows 10 我尝试通过安装变压器https huggingface co transformers https huggingface co transformers 在我的环境
如何从 Python 3.5 降级到 3.4

我想安装 kivy 链接在这里 https kivy org docs installation installation windows html install win dist 用于项目但是当尝试使用 pip 安装它所依赖的包时
Eclipse PTP：在本地计算机上运行并行（MPI）应用程序？

必须如何配置 eclipse PTP 才能在本地计算机上使用 OpenMPI 运行 MPI 应用程序使用添加资源管理器我可以选择 OpenMPI 并在连接名称中切换到本地主机但仍然要求我提供一些用户名和密码这是正确的方法吗 D
让 Bazel 使用 Python3 运行（语法错误）

我正在尝试使用 Bazel 运行此代码 https github com google in silico labeling https github com google in silico labeling 这是关联的 Bazel BU
在Python 3中将二进制字符串转换为字节数组

尽管有很多相关的问题但我找不到任何符合我的问题的问题我想更改二进制字符串例如 0110100001101001 转换成字节数组同一个例子 b hi 我试过这个 bytes int i for i in 011010000110100
使用 Python 客户端库进行 gcp 计算 API 传递凭证的内容和方式

我想使用 python google client api 获取项目中所有实例的列表google api python client 1 7 11我正在尝试使用方法连接googleapiclient discovery build此方法需要
Python组合目录中的所有csv文件并按日期时间排序

我有 2 年的每日数据分成每月文件我想将所有这些数据合并到一个按日期和时间排序的文件中我正在使用的代码组合了所有文件但不按顺序我正在使用的代码 import pandas as pd import glob os import cs
带圆角的 Seaborn 条形图

我正在尝试绘制一些条形图但想控制角的圆度我尝试按照堆栈问题中提供的答案进行操作Matplotlib 中带圆角的条形图 https stackoverflow com questions 58425392 bar chart with r
使用并行任务库时“foreach”失败

以下代码创建正确数量的文件但每个文件都包含第一个列表的内容有人能发现我做错了什么吗 private IList
在 Tkinter 中使用锚点

我正在尝试对自动点唱机进行编程但是我还处于早期阶段并且在使用时遇到了问题anchor 这是我的代码 from tkinter import from tkinter import messagebox as box def main m
对产品列表进行分类的算法？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个代表或多或少相同的产品的列表例如在下面的列表中它们都是希捷硬盘希捷硬盘 500Go 适用于笔记本电脑的希捷硬盘 120
安装 gstreamer 对 opencv python 包的支持

我已经从源代码构建了自己的 opencv python 包 import cv2 print cv2 version 打印 3 4 5 现在我面临的问题是关于 opencv 的 VideoCapture 类中的 gstreamer 的使用
如何在日志中查看MySqlHook结果

我在用MySqlHook建立连接气流数据库并且我正在执行一些查询但我需要在某处查看查询的结果比如说日志我怎样才能看到这是示例代码 t1 MySqlOperator task id basic mysql mysql conn id
Yocto 如何停止 cmake 在本机 sysroot 路径中查找链接？

到目前为止我正在尝试将 dlib python 模块添加到我的图像中这是我正在研究的食谱 python3 dlib 19 21 1 bb SUMMARY A toolkit for making real world machine l
Pipenv-Error：ModuleNotFoundError：没有名为“pip._internal”的模块[重复]

这个问题在这里已经有答案了今天我通过安装了 Pipenv pip install pipenv 正如文档中提到的我进入测试目录并使用创建了一个新的虚拟环境 pipenv shell 并尝试通过安装包 pipenv install nu
Instagram 图表 api 日期之间的媒体帖子

我正在尝试使用以下方法从我管理的 Instagram Business 个人资料中检索上个月的媒体帖子 since and until 但它似乎无法正常工作因为 API 返回的帖子超出了我选择的时间范围我使用以下字符串来调用 API b
parList 和 parBuffer 如何选择？

我从 haskell 并行开始我已经成功学习了如何使用一些策略例如 r0 rseq rdeepseq parList parMap 现在我正在进一步寻求更高的效率所以这是我的问题有什么区别parList and parBuffer
将 csv 文件按多列拆分为 panda 数据框

我有一个包含多列的 tsv 文件有 10 多列但对我来说重要的列是名称为 user name shift id url id 的列我想创建一个数据框首先根据用户名分隔整个 csv 文件即只有具有相同用户名的行才会分组在一起从该块
避免在列表理解中计算相同的表达式两次[重复]

这个问题在这里已经有答案了我在列表理解中使用一个函数和一个 if 函数 new list f x for x in old list if f x 0 令我恼火的是这个表达f x 在每个循环中计算两次有没有办法以更清洁的方式做到这一点
连接运算符 + 或 ,

var1 abc var2 xyz print literal var1 var2 literalabcxyz print literal var1 var2 literal abc xyz 除了带有的自动空格之外两者有什么区别哪个通

随机推荐

软件音频线路输入

这可能是也可能不是询问的地方如果不是就直接扔掉它我有一个正在输出音频的软件我想将其路由到另一个软件简单的解决方案是将耳机插孔连接到麦克风插孔或在计算机上启用立体声混音但是我想要做的进一步实现将在一台机器上发生 2 个这样的实例
三层 Asp.Net 应用程序中的异常处理

1 据我了解在three tierAsp Net应用程序我们应该通过以下方式实现异常处理 a 我们应该把try catch围绕代码块位于三层中的任何一层我们希望页面能够从该代码块正常恢复当此代码生成异常时 b 我们不应该放try c
在 Oracle 中创建数据库链接时出错

我有两个数据库需要编写跨数据库查询所以我试图创建一个数据库链接 CREATE PUBLIC DATABASE LINK DBLink CONNECT TO SchemaName IDENTIFIED BY 123 using DBNam
在 Java/Android 中检查字符串是否包含 URL 的最佳方法是什么？

在 Java Android 中检查字符串是否包含 URL 的最佳方法是什么最好的方法是检查字符串是否包含 com net org info 其他或者有更好的方法吗 url 输入到 Android 中的 EditText 中它可以是粘
在 C++11 中，返回指向 std::string 中某个位置的引用/指针的最高效方法是什么？

我正在构建一个使用的文本解析器std string作为字符串的核心存储我知道这不是最佳的编译器内的解析器为此使用优化的方法在我的项目中我不介意损失一些性能来换取更清晰和更容易的维护一开始我将大量文本读入内存然后扫描每个字符以构
动态/条件 SQL 连接？

我在 MSSQL 表 TableB 中有数据其中 dbo tableB myColumn 在特定日期后更改格式我正在做一个简单的连接到该表 Select dbo tableB theColumnINeed from dbo tableA
在 iPhone 中使用 Soap Web 服务与 wsdl2objc？

我确实意识到这是一个重复的问题但是唯一的其他问题已经很老了所以我想知道是否有人最近有过使用最新版本的经验wsdl2objc http code google com p wsdl2objc 我正在编写一个应用程序该应用程序将与第三方应
图像识别后如何在vuforia sdk ImageTarget中显示布局而不是茶壶模型

如果图像在 qualcomm vuforia sdk 中被识别我们如何在布局中显示简单的文本即 Hello 我正在使用 ImageTarget 的 qualcomm vuforia sdk 示例现在它在识别图像后显示一个茶壶我是增强
Java 7 watchservice获取文件更改偏移量

我刚刚尝试使用 Java 7 WatchService 来监视文件的更改这是我敲出的一些代码 WatchService watcher FileSystems getDefault newWatchService Path path Pa
无法分配请求的地址 - 可能的原因？

我有一个由主服务器和分布式从服务器组成的程序从属服务器向服务器发送状态更新如果服务器在固定时间内没有收到特定从属服务器的消息则会将该从属服务器标记为关闭这种情况一直在发生通过检查日志我发现从站只能向服务器发送一个状态更新然后永
如何在 MSVS 2012+ 编辑器（和 .NET？）中使用正则表达式替换插入“\”+“n”

在 Visual Studio 2013 的编辑器中我理解它与 2012 非常相似据称使用 NET 正则表达式我无法获取替换字符串来插入反斜杠和 n 这可能吗我想插入 n 在第一个之后在 C 程序的某些但不是全部行上即使字
如何在pandas中将字符串转换为没有日期的日期时间

例如issue d数据框中的列是字符串 df issue d Dec 2012 我想将字符串转换为日期时间类型而不是字符串类型 2012 12 怎么做 I use datetime strptime x b Y for x in df is
镀铬中的 SVG 条带

I am using a svg file to produce a smooth gradient when I noticed some serious banding issues in Google Chrome 20 Even s
如何让我的“点击”功能与 iOS 配合使用

我有一组充当按钮的 Div 这些按钮有一个简单的 jquery click 函数该函数适用于除 iOS 之外的所有浏览器例如 div class button click me div and button click function
如何使对象“a == b”的比较成立？ [复制]

这个问题在这里已经有答案了这是面试前 JavaScript 在线测试的问题之一 function F var a new F var b new F Q 如何进行比较a b to be true e g console log a b t
在 Android 中通过蓝牙接收音频

我想创建一个能够接收音频流的 Android 应用程序我想过使用 A2DP 配置文件但似乎 Android 不支持 A2DP 接收器看起来有很多人正在寻找这个问题的解决方案但是接收普通的比特流然后在应用程序中将数据转换为音频呢我
从 1D 列表创建 2D 列表

我对 Python 有点陌生我想将一维列表转换为二维列表给定width and length这个的matrix 说我有一个list 0 1 2 3 我想做一个2 by 2该列表的矩阵我怎样才能得到matrix 0 1 2 3 widt
如何在 Spring 5 MVC 中将 FilePart 转换为 byte[]

我有从网络表单接收和上传文件的控制器方法如何从 FilePart 中提取字节数组并将其保存到数据库我可以通过使用 FilePart transferTo 将 FilePart 保存到文件中来完成此操作但这看起来又慢又难看有更好的方法
如何扩展/架构 ASP.NET MVC 3 授权属性来处理这种情况

我一直在努力思考这个答案但找不到如何正确执行此操作的好解决方案我读过这些文章 http schotime net blog index php 2009 02 17 custom authorization with aspnet mv
如何在Python中使用多处理来加速循环执行

我有两个清单列表 A 包含 500 个单词列表 B 包含 10000 个单词我正在尝试为列表 A 找到与 B 相关的相似单词我正在使用 Spacy 的相似函数我面临的问题是计算需要很长时间我是多处理使用的新手因此请求帮助如何

如何在Python中使用多处理来加速循环执行

如何在Python中使用多处理来加速循环执行 的相关文章

随机推荐

热门标签

如何在Python中使用多处理来加速循环执行的相关文章