深入了解Node.js 中的多线程和多进程-站长资讯网

深入了解Node.js 中的多线程和多进程

Node.js 是一个免费的跨平台 JavaScript 运行时环境，尽管它本质上是单线程的，但是可以在后台使用多个线程来执行异步代码。

由于 Node.js 的非阻塞性质，不同的线程执行不同的回调，这些回调首先委托给事件循环。 Node.js 运行时负责处理所有这一切。

为什么要使用NodeJS？

JavaScript 最初是作为一种单线程编程语言构建的，仅在 Web 浏览器中运行。这意味着在一个过程中，只有一组指令能够在给定的时间执行。

仅在当前代码块的执行完成后，才移至下一个代码块。但是，JavaScript 的单线程性质使实现变得容易。

最初，JavaScript 对于仅用于向网站添加少量交互。所以并没有对多线程的需求。但是时代已经变了，用户要求也越来越高，JavaScript 已成为“Web 上流行的编程语言”。

多线程现在变得很普遍。由于 JavaScript 是单线程语言，因此无法在其中实现多线程。幸运的是，在这种情况下，有一个很好的解决方法：Node.js。

Node.js 框架并不少，这要归功于 JavaScript 运行时环境（尤其是 JavaScript）的普遍流行。在继续本文之前，让我们了解一些有关 Node.js 的重要观点：

可以用 send 函数将消息从子进程传递到其他子进程和主进程
支持 fork 多个进程
主进程和子进程之间不共享状态

为什么要 fork 进程？

在两种情况下，我们需要 fork 一个流程：

通过将任务委派给其他进程来提高速度
用于释放内存和卸载单个进程

可以将数据发送到子进程，也可以将其送回。

Node.js 的方式

Node.js 使用两种类型的线程：

通过事件循环处理主线程，
工作池中有许多辅助线程

事件循环负责获取回调或函数，并将其注册以供将来执行。它与正确的 JavaScript 代码在同一线程中运行。一旦 JavaScript 操作阻塞了线程，事件循环也会被阻塞。

工作池是一个执行模型，负责产生和处理不同的线程。它同步执行任务，然后将结果返回到事件循环，最后事件循环将结果提供给回调。

总而言之，工作池负责异步 I/O 操作，即与系统磁盘和网络的交互。像 fs 和 crypto 这样的模块是使用工作池的主要模块。

由于工作池是在 libuv 库中实现的，Node.js 在 JS 和 C++ 之间进行内部通信时会稍有延迟。不过这几乎是不可察觉的。

一切都很好，直到我们遇到同步执行复杂操作的要求。任何需要大量时间执行的函数都会导致主线程阻塞。

如果程序具有多个占用大量 CPU 的函数，将会导致服务器吞吐量的显着下降。在最坏的情况下，服务器将会失去响应，并且无法将任务委派给工作池。

诸如 AI、大数据和机器学习之类的领域无法从 Node.js 中受益，因为这些操作阻塞了主线程，并使服务器失去响应。但是这随着 Node.js v10.5.0 的到来而改变，该版本增加了对多线程的支持。

并发和 CPU 绑定任务的挑战

在 JavaScript 中建立并发可能很困难。允许多个线程访问相同的内存会导致竞争状态，这不仅使故障难以重现，而且解决起来也很困难。

Node.js 最初被实现为基于异步 I/O 的服务器端平台。通过简单地消除线程需求，这使很多事情变得容易。是的，Node.js 程序是单线程的，但不是典型的方式。

我们可以在 Node.js 中并行运行，但是不需要创建线程。操作系统和虚拟机共同并行使用 I/O，然后在需要将数据发送回 JavaScript 代码时，JS 代码在单个线程中运行。

除 JS 代码外，所有内容均在 Node.js 中并行运行。与异步块不同，JS 的同步块总是一次执行一次。与代码执行相比，等待 JS 中产生 I/O 事件所话费的时间要多得多。

Node.js 程序仅调用所需的函数或回调，而不会阻止其他代码的执行。最初 JavaScript 和 Node.js 都不打算处理 CPU 密集型或 CPU 绑定的任务。

当代码最少时，执行将会是敏捷的。但是计算量越大，执行速度就越慢。

如果你仍然尝试在 JS 和 Node 中完成 CPU 密集型任务，那么将会使浏览器中的 UI 冻结并对所有 I/O 事件进行排队处理。尽管如此，我们已经走了很远。现在有了 worker_threads 模块。

worker_threads 模块使多线程变得简单

Node.js v10.5.0 于 2018 年 6 月发布，引入了 worker_threads 模块。它有助于在流行的 JavaScript 运行时环境中实现并发。该模块允许创建功能齐全的多线程 Node.js 应用。

从技术上讲，工作线程是在单独的线程中产生的一些代码。要开始使用辅助线程，需要先导入 worker_threads 模块。之后需要创建 Worker 类的实例以创建工作线程。

创建 Worker 类的实例时，有两个参数：

第一个参数提供扩展名 .js 或 .mjs 的文件路径，其中包含工作程序线程的代码，
第二个参数提供了一个包含 workerData 属性的对象，该属性包含工作线程开始执行时将访问的数据

辅助线程能够调度多个消息事件。因此，回调方法优先于返回 promise。

工作线程之间的通信是基于事件的，即侦听器设置为在工作线程发送事件后立即调用。最常见的 4 个事件是：

worker.on('error', (error) => {});

当工作线程中有未捕获的异常时发出。接下来工作线程终止，并且该错误可以作为回调中的第一个参数使用。

worker.on('exit', (exitCode) => {})

当辅助线程退出时发出。如果在工作线程中调用了 process.exit()，则会将 exitCode 提供给回调。如果 worker.terminate() 终止工作线程，则代码为 1。

worker.on('message', (data) => {});

当工作线程将数据发送到父线程时发出。

worker.on('online', () => {});

当工作线程停止解析 JS 代码并开始执行时发出。尽管不常用，但 online 事件在特定情况下可能会提供

一	二	三	四	五	六	日
« 11月
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

深入了解Node.js 中的多线程和多进程

为什么要使用NodeJS？

为什么要 fork 进程？

Node.js 的方式

并发和 CPU 绑定任务的挑战

worker_threads 模块使多线程变得简单

相关推荐

热门标签

近期文章