python的进程

首页 > python的进程

python的进程

多进程概念：　　

　　由于GIL的存在，python中的多线程其实并不是真正的多线程，如果想要充分地使用多核CPU的资源，在python中大部分情况需要使用多进程。python提供了非常好用的多线程包(multiprocessing)，只需要定义一个函数,Python会完成其他所有事情。借助这个包，可以轻松完成从单进程到并发执行的转换。multiprocessing支持子进程、通信和共享数据、执行不同形式的同步，提供了Process、Queue、Pipe、Lock等组件。

　　multiprocessing包是Python中的多进程管理包。与threading.Thread类似，它可以利用multiprocessing.Process对象来创建一个进程。该进程可以运行在Python程序内部编写的函数。该Process对象与Thread对象的用法相同，也有start(), run(), join()的方法。此外multiprocessing包中也有Lock/Event/Semaphore/Condition类 (这些对象可以像多线程那样，通过参数传递给各个进程)，用以同步进程，其用法与threading包中的同名类一致。所以，multiprocessing的很大一部份与threading使用同一套API，只不过换到了多进程的情境。

但在使用这些共享API的时候，我们要注意以下几点:

在UNIX平台上，当某个进程终结之后，该进程需要被其父进程调用wait，否则进程成为僵尸进程(Zombie)。所以，有必要对每个Process对象调用join()方法 (实际上等同于wait)。对于多线程来说，由于只有一个进程，所以不存在此必要性。
multiprocessing提供了threading包中没有的IPC(比如Pipe和Queue)，效率上更高。应优先考虑Pipe和Queue，避免使用Lock/Event/Semaphore/Condition等同步方式 (因为它们占据的不是用户进程的资源)。
多进程应该避免共享资源。在多线程中，我们可以比较容易地共享资源，比如使用全局变量或者传递参数。在多进程情况下，由于每个进程有自己独立的内存空间，以上方法并不合适。此时我们可以通过共享内存和Manager的方法来共享资源。但这样做提高了程序的复杂度，并因为同步的需要而降低了程序的效率。

Process.PID中保存有PID，如果进程还没有start()，则PID为None。

window系统下，需要注意的是要想启动一个子进程，必须加上那句if __name__ == "main"，进程相关的要写在这句下面。

 1 from multiprocessing import Process
 2 import time,os
 3 
 4 
 5 def f(name):
 6     time.sleep(1)
 7     print('%s,父进程：%s;子进程:%s'%(name,os.getppid(),os.getpid()))
 8 
 9 if __name__ == "__main__":
10     p_list=[]
11     for i in range(8):  # 若进程数超过系统本身CPU的核数，就会发生进程的切换
12         p=Process(target=f,args=('Adair',))
13         p_list.append(p)
14         p.start()
15     for i in p_list:
16         p.join()  # 防止出现僵尸进程
17 
18     print("父进程执行结束！")

类式调用：

 1 from multiprocessing import Process
 2 import time,os
 3 
 4 class MyProcess(Process):
 5     def __init__(self):
 6         super(MyProcess,self).__init__()
 7 
 8     def run(self):
 9         time.sleep(1)
10         print('%s,父进程：%s;子进程:%s'%(self.name,os.getppid(),os.getpid()))
11 
12 if __name__ == "__main__":
13     p_list=[]
14     for i in range(3):
15         p = MyProcess()
16         p.start()
17         p_list.append(p)
18 
19     for i in p_list:
20         i.join()
21 
22     print("父进程结束！")

Process类：

　　构造方法：

　　Process([group [,target [,name[,args[,kwarge]]]])

　　　　group：线程组，目前还没实现，库引用中提示必须是None

　　　　target：要执行的方法

　　　　name：进程名

　　　　args / kwargs：要传入方法的参数

　　实例方法：

　　　　is_alive()：返回进程是否在运行

　　　　join([timeout])：阻塞当前上下文环境的进程，直到调用此方法的进程终止或者达到指定的timeout（可选参数）

　　　　start()：进程准备就绪，等待CPU调度

　　　　run()：start()调用run方法，如果实例进程时未指定传入的target，这start执行默认run()方法

　　　　terminate()：不管任务是否完成，立即停止工作进程

　　属性：

　　　　authkey

　　　　daemon：和进程的setDeamon功能一样

　　　　exitcode(进程在运行时为None、如果为-N，表示被信号N结束)

　　　　name：进程名

　　　　pid：进程号

进程间通讯：

　　不同进程间内存是不共享的，要想实现两个进程间的数据交换，可以用一下方法：

　　Queues

　　使用方法跟threading里的queue类似：

 1 from multiprocessing import Process,Queue
 2 
 3 def foo(q,n):
 4     q.put([42,n,"Adair."])
 5 
 6 if __name__ == "__main__":
 7     q = Queue()
 8     # print("q:",q)
 9     p_list=[]
10     for i in range(3):
11         p = Process(target=foo,args=(q,i))
12         p_list.append(p)
13         p.start()
14         print(p.pid)
15     print(q.get())
16     print(q.get())
17     print(q.get())
18 
19     for i in p_list:
20         i.join()

转载于:https://www.cnblogs.com/Adairye/p/10188126.html