Python - 使用线程或队列迭代调用函数的 for 循环


我对 python 相当陌生,正在制作一个脚本,允许将其他程序的点云数据引入 Autodesk Maya。我的脚本运行良好,但我想做的是让它更快。我有一个 for 循环,它遍历编号文件的列表。 IE。 datafile001.txt、datafile002.txt 等。我想知道是否有一种方法可以让它一次执行多个操作,可能使用线程或队列?下面是我一直在研究的代码:

     def threadedFuntion(args):
         if len(sourceFiles) > 3:
             for count, item in enumerate(sourceFiles):
                     t1=Thread(target=convertPcToPdc,args=(sourceFiles[filenumber1], particlesName, startframe, endframe, pdcIncrements, outputDirectory, variableFolder, acceptableArrayforms, dataType))
                     t2=Thread(target=convertPcToPdc,args=(sourceFiles[filenumber2], particlesName, startframe, endframe, pdcIncrements, outputDirectory, variableFolder, acceptableArrayforms, dataType))
                     t3=Thread(target=convertPcToPdc,args=(sourceFiles[filenumber3], particlesName, startframe, endframe, pdcIncrements, outputDirectory, variableFolder, acceptableArrayforms, dataType))
                     t4=Thread(target=convertPcToPdc,args=(sourceFiles[filenumber4], particlesName, startframe, endframe, pdcIncrements, outputDirectory, variableFolder, acceptableArrayforms, dataType))

由于多种原因,这显然不起作用,首先它只会创建 4 个线程,我希望能够提供更多或更少的选项。其次它会出错,因为它试图重用线程?就像我说的,我对 python 很陌生,而且有点不知所措,我已经阅读了这里的几篇文章,但无法让其中一篇正常工作。我认为队列可能是我需要的东西,但无法完全弄清楚,我尝试了条件语句和连接语句,但再次无法得到我想要的。

我想更具体地说,我想要实现的是该函数正在读取文本文件,检索坐标,然后将它们导出为二进制文件以供 Maya 读取。这些文本文件之一通常具有 5-1000 万个 x、y、z 坐标,这需要相当长的时间。在一台相当糟糕的计算机上完成 1 个文件大约需要 30 分钟到 1 小时,任务管理器说 python 只使用 12% 的处理器和大约 1% 的内存,所以如果我可以一次完成其中多个文件,那么就可以完成这 100 个或文件越多,速度就越快。我不认为多线程/排队 for 循环会很困难,但我已经迷失并尝试了大约一周的失败解决方案。


子类 threading.Thread 并将工作函数作为 run() 的一部分放入该类中。

import threading
import time
import random

class Worker(threading.Thread):
    def __init__(self, srcfile, printlock,**kwargs):
        self.srcfile = srcfile
        self.lock = printlock # so threads don't step on each other's prints

    def run(self):
        with self.lock:
            print("starting %s on %s" % (self.ident,self.srcfile))
        # do whatever you need to, return when done
        # example, sleep for a random interval up to 10 seconds
        with self.lock:
            print("%s done" % self.ident)

def threadme(srcfiles):
    printlock = threading.Lock()
    threadpool = []
    for file in srcfiles:

    for thr in threadpool:

    # this loop will block until all threads are done
    # (however it won't necessarily first join those that are done first)
    for thr in threadpool:

    print("all threads are done")

if __name__ == "__main__":


def threadme(infiles,threadlimit=None,timeout=0.01):
    assert threadlimit is None or threadlimit > 0, \
           "need at least one thread";
    printlock = threading.Lock()
    srcfiles = list(infiles)
    threadpool = []

    # keep going while work to do or being done
    while srcfiles or threadpool:

        # while there's room, remove source files
        # and add to the pool
        while srcfiles and \
           (threadlimit is None \
            or len(threadpool) < threadlimit):
            file = srcfiles.pop()
            wrkr = Worker(file,printlock)

        # remove completed threads from the pool
        for thr in threadpool:
            if not thr.is_alive():

    print("all threads are done")

if __name__ == "__main__":
    for lim in (1,2,3,4):
        print("--- Running with thread limit %i ---" % lim)

请注意,这实际上会反向处理源(由于列表 pop())。如果您要求它们按顺序完成,请在某处反转列表,或使用双端队列和 popleft()。


