link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

Hello World

上面从刚刚介绍了进程、线程、协程的区别，下面就开始真正的线程介绍。Talk is cheap. Show me the code。

我们用斐波拉切数列为例，使用 C++ 和 Javascript 展示一下多线程计算。

// 一般在 linux 使用上都是使用 posix 库，需要带上 lpthread

int calc ( int i ) {

if ( i < 3 ) {

return 1 ;

}

return calc ( i - 1 ) + calc ( i - 2 ) ;

}

int fibonacci ( int i ) {

int result = calc ( i ) ;

printf ( "Result: %d \n" , result ) ;

return result ;

}

int main ( ) {

vector < thread > vec ;

for ( int i = 0 ; i < 5 ; i ++ ) {

thread t ( fibonacci , i * 10 ) ;

vec . push_back ( std :: move ( t ) ) ;

}

for ( auto & t : vec ) {

t . join ( ) ;

}

printf ( "Thread End" ) ;

return 0 ;

}

// main.js

const taskArray = [ ] ;

for ( let i = 0 ; i < 5 ; i ++ ) {

taskArray . push ( new Promise ( ( resolve , reject ) = > {

const worker = new Worker ( './thread.js' ) ;

worker . onmessage = ( e ) = > {

resolve ( ) ;

worker . terminate ( ) ;

} ;

worker . postMessage ( i * 10 ) ;

} ) ) ;

}

Promise . all ( taskArray ) . then ( ( ) = > {

console . log ( 'Thread End' ) ;

} ) . catch ( ( ) = > {

console . error ( 'Thread Error' ) ;

} ) ;

// thread.js

function calc ( i ) {

if ( i < 3 ) {

return 1 ;

}

return calc ( i - 1 ) + calc ( i - 2 ) ;

}

function fibonacci ( i ) {

let result = calc ( i . data ) ;

console . log ( "Result: %d" , result ) ;

return result ;

}

onmessage = function ( i ) {

fibonacci ( i ) ;

postMessage ( true ) ;

}

语法都非常简单，这里就不解释了，不过看完之后可能会有感触：

无论是 go 的协程还是 c++ 的代码都挺好理解的（得益于 c++11 标准化），javascript 看上去反而是最复杂的一个（这看起来都已经是跨进程的体验了），不是说：

「凡是可以用 JavaScript 来写的应用，最终都会用 ~~JavaScript~~ TypeScript 来写。」

这里是因为 javascript 运行在浏览器内核下，以 chromium 内核为例，它并没有真正的支持上线程的特点：内存共享，所以普通的 js 线程和 worker 线程在通信上就有了一个 message 传输的现象。

这里插个广告，推荐 AlloyWorker ，是团队成员 cnt 大佬开发的一个库，可以让你在 js 上更爽的使用 worker 能力。

再来说说为什么 js 被设计成这样（这里指的都是浏览器端运行的 js），因为 js 运行在浏览器端 => js 最根本的指责就是操作 dom，这是不可改变的。
如果有多个线程，有线程要设置 dom 属性，有的要删除 dom，浏览器都裂开了，完全顶不住。数据库的分布式原则也是单个写服务，多读服务，也是避免了写操作冲突的情况。（后面会提到写冲突的一些事情）

但是 worker 不能操作 dom 啊，为什么还要和 js 主线程内存隔离？

目前应该主要还是安全性考虑和 js 语言本身导致的复杂性。目前 ES8 引入的 SharedArrayBuffer 已经用缓冲区的方式实现了真正的内存共享。

多线程的优势

你可以不了解多线程，但是你一定知道多线程的技术是为了性能。针对程序性能，我们先讲解一下关于程序执行的三个 time

go 协程执行斐波拉切数列的耗时

real(Wall Clock Time) 为时钟时间，也就是程序执行的自然时间，这也是我们直接感受到程序的耗时。

user 为用户时间，也就是代码执行的时间。

sys 为内核时间，是内核工作的一些耗时。

也就是我们从执行到看到结果，一共等待了 9s，时间还是挺长的，我们如果用迭代改写，可以看到时间有大幅度的优化

递归改成迭代的耗时

real 的耗时基本上可以理解为 real = user / 执行内核数量 + sys

我们知道单核 cpu 也可以并发执行多个任务，靠的是 cpu 自身频繁的切换调度，并不是真正的并行， 所以两个耗时 5s 的任务，在单核下，无论是来回切换执行，还是顺序执行，最终的耗时一定都是 10s。

下面是一个验证，首先是这样的代码

// 多线程

void stop ( ) {

// 耗时操作大概 5s

int d = 0 ;

for ( int n = 0 ; n < 10000 ; ++ n ) {

for ( int m = 0 ; m < 100000 ; ++ m ) {

d += d * n * m ;

}

int main ( ) {

std :: thread t1 ( stop ) ;

std :: thread t2 ( stop ) ;

t1 . join ( ) ;

t2 . join ( ) ;

return 0 ;

}

那么多线程编程是不是在单核架构下就毫无作为了呢？当然不是，顺序执行意味着 cpu 是固定死了，不跑完不罢休。

中途如果有交互、网络请求，统统 hold 住，而很多情况下，用户宁愿卡死，也不希望页面毫无反应。下面的地址是一个🌰: https://vorshen.github.io/blog/thread/js/pending/index.html

如果点击单线程卡住 5s，会发现交互和定时器全部卡死了，新启线程就没有这个问题。

多线程的坑

如上可知多线程好处多多，只是月有阴晴圆缺，多线程坑还是不少的，下面列举几个

我们知道，数据库主从方案中，基本上都是只有一个服务器作为写服务器，其中一个很大的原因就是 避免写的冲突

由于多线程的内存区域是共享的，写冲突的情况很容易出现，出现之后会是什么现象呢？我们看下面的代码分析

int sum = 0 ;

void add ( ) {

for ( int i = 0 ; i < 10000 ; i ++ ) {

sum ++ ;

}

int main ( ) {

std :: thread t1 ( add ) ;

std :: thread t2 ( add ) ;

t1 . join ( ) ;

t2 . join ( ) ;

printf ( "Result: %d \n" , sum ) ;

return 0 ;

}

4 : c7 45 fc 00 00 00 00 mov DWORD PTR [ rbp - 0x4 ] , 0x0

b: 81 7d fc 0f 27 00 00 cmp DWORD PTR [ rbp - 0x4 ] , 0x270f

12 : 7f 15 jg 29 < _Z3addv + 0x29 >

14 : 8b 05 00 00 00 00 mov eax , DWORD PTR [ rip + 0x0 ] # 1a < _Z3addv + 0x1a >

1a : 83 c0 01 add eax , 0x1

1d : 89 05 00 00 00 00 mov DWORD PTR [ rip + 0x0 ] , eax # 23 < _Z3addv + 0x23 >

23 : 83 45 fc 01 add DWORD PTR [ rbp - 0x4 ] , 0x1

27 : eb e2 jmp b < _Z3addv + 0xb >

6 : b8 10 27 00 00 mov eax , 0x2710

b: 83 e8 01 sub eax , 0x1

e: 75 fb jne b < _Z3addv + 0xb >

10 : 8d 82 10 27 00 00 lea eax , [ rdx + 0x2710 ]

16 : 89 05 00 00 00 00 mov DWORD PTR [ rip + 0x0 ] , eax # 1c < _Z3addv + 0x1c >

1c : c3 ret

可以看到， 这里直接用 add 指令替代了 move ，没有了「先取出来-> 修改-> 再写回」这个流程， 这种情况下，正好避免了写入冲突，所以没问题

一份代码如此的不可信肯定不是开发所希望的，该如何解决这样的数据冲突问题呢？

结合 mysql 写操作冲突的解决方案，可以通过加锁解决，多线程编程中确实有互斥锁的解决方案

int sum = 0 ;

std :: mutex mtx ; // 声明了一个 mtx 变量来进行锁操作

void add ( ) {

// 上锁

mtx . lock ( ) ;

for ( int i = 0 ; i < 10000 ; i ++ ) {

sum ++ ;

}

// 解除锁定

mtx . unlock ( ) ;

}

int main ( ) {

std :: thread t1 ( add ) ;

std :: thread t2 ( add ) ;

t1 . join ( ) ;

t2 . join ( ) ;

printf ( "Result: %d \n" , sum ) ;

return 0 ;

}

核心也就是多了 lock() 和 unlock() 这两个操作，也非常好理解。go 中的 sync.Mutex 也是类似的用法。javascript 中，针对 localStorage 的线程安全，也有 mutex 的实现，感兴趣的同学可以了解。

用了锁，就得考虑死锁 ，死锁的直接原因就是某个线程 lock 之后没有正常的 unlock（比如 throw error 了），这也是没有满足 RAII 机制。

C++ 为此提供了 std::lock_guard 和 std::uniqe_lock 对象可以与 std::mutex 配合使用，用法并不复杂，这里不进行详细展开。

但是加锁的开销是很大的，一些小场景下，希望可以更轻量的解决冲突问题，此时可以使用「原子化 atomic」方案。

C++ 支持了 atomic，不过目前支持的类型还比较少，我们可以试一下

// atomic int 类型

// atomic(const atomic&) = delete 拷贝构造函数被删除

std :: atomic < int > sum { 0 } ;

void static add ( ) {

for ( int i = 0 ; i < 10000 ; i ++ ) {

sum ++ ;

}

int main ( ) {

std :: thread t1 ( add ) ;

std :: thread t2 ( add ) ;

t1 . join ( ) ;

t2 . join ( ) ;

int temp = sum ;

printf ( "Result: %d \n" , temp ) ;

return 0 ;

}

这里原子化是如何保证不会出现数据冲突就比较复杂了，我们下次再说。
注意，复杂场景下请使用互斥锁的方案，基础数据类型简单场景下，可以使用 atomic 降低开销，不要强求无锁编程。

一个普通的单线程程序，调试起来无论是流程还是堆栈，看起来都是比较清晰的：

基本上单线程调试的复杂度，是随着代码复杂度，常数级增加（一般不会超过线性级）。

但是涉及到多线程，这里复杂度就会明显上升：

而多线程的调试，随着代码复杂度+线程数目，复杂度很容易变成指数级。

针对这种痛点，多打日志，多打日志，多打日志。

系统调度开销

我们知道 nginx 有一个 worker_process 的参数，可以设置启动的 worker 进程的数量

网上某些经验推荐可以是 cpu 数目*2，为什么不把直接拉满呢，这里就是因为进程数过多，会有很多内核切换的开销。

线程相比较进程，虽然调度开销少了很多，但还是会存在这样的问题，我们可以简单用代码测试一下。

首先是单线程代码：

void stop ( ) {

// 耗时操作大概 0.005s

int d = 0 ;

for ( int n = 0 ; n < 1000 ; ++ n ) {

for ( int m = 0 ; m < 1000 ; ++ m ) {

d += d * n * m ;

}

int main ( ) {

for ( int i = 0 ; i < 1000 ; ++ i ) {

stop ( ) ;

}

return 0 ;

}

// result

// real 0m5.121s

// user 0m5.116s

// sys 0m0.001s

void stop ( ) {

// 耗时操作大概 0.005s

int d = 0 ;

for ( int n = 0 ; n < 1000 ; ++ n ) {

for ( int m = 0 ; m < 1000 ; ++ m ) {

d += d * n * m ;

}

int main ( ) {

std :: vector < std :: thread > vec ;

for ( int i = 0 ; i < 1000 ; ++ i ) {

vec . push_back ( std :: move ( std :: thread ( stop ) ) ) ;

}

for ( auto & t : vec ) {

t . join ( ) ;

}

return 0 ;

}

// result

// real 0m2.616s

// user 0m5.151s

// sys 0m0.057s

启动了 1000 个线程去计算后，可以看到 sys 的时间明显增加，所以使用多线程也需要心中有数，不要负优化了。

我们简单介绍了下多线程的背景知识，也对多线程编程有了入门的讲解，最后罗列出来了一些多线程存在的注意问题，坑点

后面有时间，会分析一下一些大型项目中多线程的使用～

最后留个多线程的题目，感兴趣的同学可以尝试一下：
https://leetcode-cn.com/problems/the-dining-philosophers/