python日记(一):为什么我的多线程速度反而不如单线程? 您所在的位置:网站首页 使用线程池速度速度反正变慢 python日记(一):为什么我的多线程速度反而不如单线程?

python日记(一):为什么我的多线程速度反而不如单线程?

2024-07-12 07:45| 来源: 网络整理| 查看: 265

Background(废话,可以跳过不看)

今天使用在实际操作中,需要求一个矩阵中每个结点对之间相似度,矩阵的大小大概有17000+,所以一共需要计算结点对17000×17000=?????辣么老多个。计算了一下大概需要三个小时以上。 然后就想到了以前用过的多线程爬虫,简直爽到飞起,所以想着用多线程可以是不是可以提高循环计算的速度?然后就动手写了一个多线程,但是发现速度甚至不及单线程,甚至还要更慢。Excuse Me???? 然后就去查看了一下别的大佬怎么讲。

python线程原理(敲黑板)

下面引入一个概念GIL。我们看官方给出的解释:

In CPython, the global interpreter lock, or GIL, is a mutex that prevents multiple native threads from executing Python bytecodes at once. This lock is necessary mainly because CPython’s memory management is not thread-safe. (However, since the GIL exists, other features have grown to depend on the guarantees that it enforces.) 这个东西本身就是一个全局的线程锁,因为python的内存管理不是线程安全的,所以GIL被用来防止多个本机线程同时执行Python字节码。简单明了地说,python好像对多线程是不太友好的。 接下来我们使用代码去验证:

weights = [] row = [] col = [] lock = threading.Lock() # 申请线程锁 time1 = time.time() def thread_cal_cosine(start,end): for i in list(struct_vocab.keys())[start:end]: for j in list(struct_vocab.keys()): if i == j: # 跳过自环 continue weight = 1 - cosine(struct_vocab[i], struct_vocab[j]) # 1-余弦距离才是余弦相似度 if weight > 0.9: # 这个参数是TextGCN里提到的 lock.acquire() # 变量加锁 weights.append(weight) row.append(i) col.append(j) lock.release() threads = [] for index in range(0, 20, 5): start = index end = index + 5 threads.append(threading.Thread(target=thread_cal_cosine, args=(start, end))) for each in threads: each.start() each.join() print('线程' + str(each) + '执行') print('len weights:', len(weights)) struct_adj = sp.csr_matrix( (weights, (row, col)), shape=(len(vocabs), len(vocabs))) # io.mmwrite(path + '{}.struct.adj.mtx'.format(dataset), struct_adj) # print(path + '{}.struct.adj.mtx'.format(dataset), struct_adj) # 稀疏矩阵特殊的存放数据方法 print('用时:', time.time() - time1)

我为结点之间相似度的计算添加了线程。为了执行效果快,我只截取了第一个for循环的前20个,实际上有17000+,最终用时:

用时: 12.304814100265503

接下来再来看单线程的:

time1 = time.time() for i in list(struct_vocab.keys())[0:20]: for j in list(struct_vocab.keys()): if i == j: # 跳过自环 continue weight = 1 - cosine(struct_vocab[i], struct_vocab[j]) # 1-余弦距离才是余弦相似度 if weight > 0.9: # 这个参数是TextGCN里提到的 weights.append(weight) row.append(i) col.append(j) print('len weights:', len(weights)) struct_adj = sp.csr_matrix( (weights, (row, col)), shape=(len(vocabs), len(vocabs))) # io.mmwrite(path + '{}.struct.adj.mtx'.format(dataset), struct_adj) # print(path + '{}.struct.adj.mtx'.format(dataset), struct_adj) # 稀疏矩阵特殊的存放数据方法 print('用时:', time.time() - time1) 用时: 12.467553615570068

这根本没差嘛!从原理上解释,尽管CPU是多核的,理论上可以执行多线程的任务。但是由于python GIL的机制,多线程并无法抢占多余的计算资源,并且在线程调度的过程中,也可能造成时间的浪费。这就使得在多线程执行的时候,效果甚至可能比单线程要慢!!!! 但是,以上缺陷只对于计算密集型任务来说,对于爬虫这种请求密集或是文件读写这种IO密集的任务,多线程还是能很好地胜任的。因为每个线程执行的时候都是在请求外部的资源,而非CPU内部的计算,线程执行之后需要很久,外部任务(比如HTTP请求)才会完成,CPU有充分的时间完成线程的切换。 所以,一句话总结: 在进行数值计算的时候,python的多线程很拉跨;在进行网络爬虫,文件读写的时候,多线程又能排上很大用场。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有