————— 第二天 —————
————————————
什么是进程和线程
有一定基础的小伙伴们肯定都知道进程和线程。
进程是什么呢?
直白地讲,进程就是应用程序的启动实例。比如我们运行一个游戏,打开一个软件,就是开启了一个进程。
进程拥有代码和打开的文件资源、数据资源、独立的内存空间。
线程又是什么呢?
线程从属于进程,是程序的实际执行者。一个进程至少包含一个主线程,也可以有更多的子线程。
线程拥有自己的栈空间。
有人给出了很好的归纳:
对操作系统来说,线程是最小的执行单元,进程是最小的资源管理单元。
无论进程还是线程,都是由操作系统所管理的。
Java 中线程具有五种状态:
初始化
可运行
运行中
阻塞
销毁
这五种状态的转化关系如下:
但是,线程不同状态之间的转化是谁来实现的呢?是 JVM 吗?
并不是。JVM 需要通过操作系统内核中的 TCB(Thread Control Block)模块来改变线程的状态,这一过程需要耗费一定的 CPU 资源。
进程和线程的痛点
线程之间是如何进行协作的呢?
最经典的例子就是生产者 / 消费者模式:
若干个生产者线程向队列中写入数据,若干个消费者线程从队列中消费数据。
如何用 java 语言实现生产者 / 消费者模式呢?
让我们来看一看代码:
public class ProducerConsumerTest { | |
public static void main(String args[]) { | |
final Queue<Integer> sharedQueue = new LinkedList(); | |
Thread producer = new Producer(sharedQueue); | |
Thread consumer = new Consumer(sharedQueue); | |
producer.start(); | |
consumer.start(); | |
} | |
} | |
class Producer extends Thread { | |
private static final int MAX_QUEUE_SIZE = 5; | |
private final Queue sharedQueue; | |
public Producer(Queue sharedQueue) { | |
super(); | |
this.sharedQueue = sharedQueue; | |
} | |
@Override | |
public void run() { | |
for (int i = 0; i < 100; i++) { | |
synchronized (sharedQueue) { | |
while (sharedQueue.size() >= MAX_QUEUE_SIZE) { | |
System.out.println("队列满了,等待消费"); | |
try { | |
sharedQueue.wait(); | |
} catch (InterruptedException e) { | |
e.printStackTrace(); | |
} | |
} | |
sharedQueue.add(i); | |
System.out.println("进行生产 : " + i); | |
sharedQueue.notify(); | |
} | |
} | |
} | |
} | |
class Consumer extends Thread {private final Queue sharedQueue; | |
public Consumer(Queue sharedQueue) { | |
super(); | |
this.sharedQueue = sharedQueue; | |
} | |
@Override | |
public void run() { | |
while(true) { | |
synchronized (sharedQueue) { | |
while (sharedQueue.size() == 0) { | |
try { | |
System.out.println("队列空了,等待生产"); | |
sharedQueue.wait(); | |
} catch (InterruptedException e) { | |
e.printStackTrace(); | |
} | |
} | |
int number = sharedQueue.poll(); | |
System.out.println("进行消费 : " + number ); | |
sharedQueue.notify(); | |
} | |
} | |
} | |
} |
这段代码做了下面几件事:
定义了一个生产者类,一个消费者类。
生产者类循环 100 次,向同步队列当中插入数据。
消费者循环监听同步队列,当队列有数据时拉取数据。
如果队列满了(达到 5 个元素),生产者阻塞。
如果队列空了,消费者阻塞。
上面的代码正确地实现了生产者 / 消费者模式,但是却并不是一个高性能的实现。为什么性能不高呢?原因如下:
涉及到同步锁。
涉及到线程阻塞状态和可运行状态之间的切换。
涉及到线程上下文的切换。
以上涉及到的任何一点,都是非常耗费性能的操作。
什么是协程
** 协程,英文 Coroutines,是一种比线程更加轻量级的存在。** 正如一个进程可以拥有多个线程一样,一个线程也可以拥有多个协程。
最重要的是,协程不是被操作系统内核所管理,而完全是由程序所控制(也就是在用户态执行)。
这样带来的好处就是性能得到了很大的提升,不会像线程切换那样消耗资源。
既然协程这么好,它到底是怎么来使用的呢?
由于 Java 的原生语法中并没有实现协程(某些开源框架实现了协程,但是很少被使用),所以我们来看一看 python 当中对协程的实现案例,同样以生产者消费者模式为例:
这段代码十分简单,即使没用过 python 的小伙伴应该也能基本看懂。
代码中创建了一个叫做 consumer 的协程,并且在主线程中生产数据,协程中消费数据。
其中 yield 是 python 当中的语法。当协程执行到 yield 关键字时,会暂停在那一行,等到主线程调用 send 方法发送了数据,协程才会接到数据继续执行。
但是,yield 让协程暂停,和线程的阻塞是有本质区别的。协程的暂停完全由程序控制,线程的阻塞状态是由操作系统内核来进行切换。
因此,协程的开销远远小于线程的开销。
协程的应用
有哪些编程语言应用到了协程呢?我们举几个栗子:
Lua 语言
Lua 从 5.0 版本开始使用协程,通过扩展库 coroutine 来实现。
Python 语言
正如刚才所写的代码示例,python 可以通过 yield/send 的方式实现协程。在 python 3.5 以后,async/await 成为了更好的替代方案。
Go 语言
Go 语言对协程的实现非常强大而简洁,可以轻松创建成百上千个协程并发执行。
Java 语言
如上文所说,Java 语言并没有对协程的原生支持,但是某些开源框架模拟出了协程的功能,有兴趣的小伙伴可以看一看 Kilim 框架的源码:
https://github.com/kilim/kilim
几点补充:
1. 关于协程的概念,小灰也仅仅是知道一些皮毛,希望小伙伴们多多指正。
2. 本漫画纯属娱乐,还请大家尽量珍惜当下的工作,切勿模仿小灰的行为哦。