當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

线程模型、pthread 系列函数和简单多线程服务器端程序

發(fā)布時(shí)間：2025/3/20 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了线程模型、pthread 系列函数和简单多线程服务器端程序小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

一、線程有3種模型，分別是N:1用戶線程模型，1:1核心線程模型和N:M混合線程模型，posix thread屬于1:1模型。

（一）、N:1用戶線程模型

“線程實(shí)現(xiàn)”建立在“進(jìn)程控制”機(jī)制之上，由用戶空間的程序庫(kù)來管理。OS內(nèi)核完全不知道線程信息。這些線程稱為用戶空間線程。這些線程都工作在“進(jìn)

程競(jìng)爭(zhēng)范圍”（process contention scope）：各個(gè)線程在同一進(jìn)程競(jìng)爭(zhēng)“被調(diào)度的CPU時(shí)間”（但不直接和其他進(jìn)程中的線程競(jìng)爭(zhēng)）。

在N:1線程模型中，內(nèi)核不干涉線程的任何生命活動(dòng)，也不干涉同一進(jìn)程中的線程環(huán)境切換。

在N:1線程模型中，一個(gè)進(jìn)程中的多個(gè)線程只能調(diào)度到一個(gè)CPU，這種約束限制了可用的并行總量。

第二個(gè)缺點(diǎn)是如果某個(gè)線程執(zhí)行了一個(gè)“阻塞式”操作（如read），那么，進(jìn)程中的所有線程都會(huì)阻塞，直至那個(gè)操作結(jié)束。為此，一些線程的實(shí)現(xiàn)是為

這些阻塞式函數(shù)提供包裝器，用非阻塞版本替換這些系統(tǒng)調(diào)用，以消除這種限制。

（二）、1:1核心線程模型?pthread線程庫(kù)--NPTL(Native POSIX Threading Library)

在1:1核心線程模型中，應(yīng)用程序創(chuàng)建的每一個(gè)線程（也有書稱為L(zhǎng)WP）都由一個(gè)核心線程直接管理。OS內(nèi)核將每一個(gè)核心線程都調(diào)到系統(tǒng)CPU上，

因此，所有線程都工作在“系統(tǒng)競(jìng)爭(zhēng)范圍”（system contention scope）：線程直接和“系統(tǒng)范圍”內(nèi)的其他線程競(jìng)爭(zhēng)。

這種線程的創(chuàng)建與調(diào)度由內(nèi)核完成，因?yàn)檫@種線程的系統(tǒng)開銷比較大（但一般來說，比進(jìn)程開銷小）

（三）、N:M混合線程模型 ?NGPT(Next Generation POSIX Threads)

N:M混合線程模型提供了兩級(jí)控制，將用戶線程映射為系統(tǒng)的可調(diào)度體以實(shí)現(xiàn)并行，這個(gè)可調(diào)度體稱為輕量級(jí)進(jìn)程（LWP:light weight process），LWP 再一一映射到核心線程。如下圖所示。OS內(nèi)核將每一個(gè)核心線程都調(diào)到系統(tǒng)CPU上，因此，所有線程都工作在“系統(tǒng)競(jìng)爭(zhēng)范圍”。

據(jù)說一些類UNIX系統(tǒng)(如Solaris)已經(jīng)實(shí)現(xiàn)了比較成熟的M:N線程模型, 其性能比起linux的線程還是有著一定的優(yōu)勢(shì)，但不能利用SMP結(jié)構(gòu)。

按照2003年3月NGPT官方網(wǎng)站上的通知，NGPT考慮到NPTL日益廣泛地為人所接受，為避免不同的線程庫(kù)版本引起的混亂，今后將不再進(jìn)行進(jìn)一步開發(fā)，而今進(jìn)行支持性的維護(hù)工作。也就是說，NGPT已經(jīng)放棄與NPTL競(jìng)爭(zhēng)下一代Linux POSIX線程庫(kù)標(biāo)準(zhǔn)。

二、posix 線程概述

我們知道，進(jìn)程在各自獨(dú)立的地址空間中運(yùn)行，進(jìn)程之間共享數(shù)據(jù)需要用進(jìn)程間通信機(jī)制，有些情況需要在一個(gè)進(jìn)程中同時(shí)執(zhí)行多個(gè)控制流程，這時(shí)候

線程就派上了用場(chǎng)，比如實(shí)現(xiàn)一個(gè)圖形界面的下載軟件，一方面需要和用戶交互，等待和處理用戶的鼠標(biāo)鍵盤事件，另一方面又需要同時(shí)下載多個(gè)文

件，等待和處理從多個(gè)網(wǎng)絡(luò)主機(jī)發(fā)來的數(shù)據(jù)，這些任務(wù)都需要一個(gè)“等待-處理”的循環(huán)，可以用多線程實(shí)現(xiàn)，一個(gè)線程專門負(fù)責(zé)與用戶交互，另外幾個(gè)線

程每個(gè)線程負(fù)責(zé)和一個(gè)網(wǎng)絡(luò)主機(jī)通信。

以前我們講過，main函數(shù)和信號(hào)處理函數(shù)是同一個(gè)進(jìn)程地址空間中的多個(gè)控制流程，多線程也是如此，但是比信號(hào)處理函數(shù)更加靈活，信號(hào)處理函數(shù)的

控制流程只是在信號(hào)遞達(dá)時(shí)產(chǎn)生，在處理完信號(hào)之后就結(jié)束，而多線程的控制流程可以長(zhǎng)期并存，操作系統(tǒng)會(huì)在各線程之間調(diào)度和切換，就像在多個(gè)進(jìn)

程之間調(diào)度和切換一樣。由于同一進(jìn)程的多個(gè)線程共享同一地址空間，因此Text Segment、Data Segment都是共享的，如果定義一個(gè)函數(shù)，在各線程

中都可以調(diào)用，如果定義一個(gè)全局變量，在各線程中都可以訪問到，除此之外，各線程還共享以下進(jìn)程資源和環(huán)境：

文件描述符表

每種信號(hào)的處理方式（SIG_IGN、SIG_DFL或者自定義的信號(hào)處理函數(shù)）

當(dāng)前工作目錄

用戶id和組id

但有些資源是每個(gè)線程各有一份的：

線程id

上下文，包括各種寄存器的值、程序計(jì)數(shù)器和棧指針

棧空間

errno變量

信號(hào)屏蔽字

調(diào)度優(yōu)先級(jí)

我們將要學(xué)習(xí)的線程庫(kù)函數(shù)是由POSIX標(biāo)準(zhǔn)定義的，稱為POSIX thread或者pthread。在Linux上線程函數(shù)位于libpthread共享庫(kù)中，因此在編譯時(shí)要加上-lpthread選項(xiàng)。

注：linux 2.6?以后的線程就是由用戶態(tài)的pthread庫(kù)實(shí)現(xiàn)的.使用pthread以后,?在用戶看來,?每一個(gè)task_struct就對(duì)應(yīng)一個(gè)線程,?而一組線程以及它們所共同引用的一組資源就是一個(gè)進(jìn)程.在linux 2.6中, 內(nèi)核有了線程組的概念, task_struct結(jié)構(gòu)中增加了一個(gè)tgid(thread group id)字段.?getpid(獲取進(jìn)程ID)系統(tǒng)調(diào)用返回的也是tast_struct中的tgid, 而tast_struct中的pid則由gettid系統(tǒng)調(diào)用來返回。
當(dāng)線程停止/繼續(xù), 或者是收到一個(gè)致命信號(hào)時(shí), 內(nèi)核會(huì)將處理動(dòng)作施加到整個(gè)線程組中。
比如程序a.out運(yùn)行時(shí)，創(chuàng)建了一個(gè)線程。假設(shè)主線程的pid是10001、子線程是10002（它們的tgid都是10001）。這時(shí)如果你kill 10002，是可以把10001和10002這兩個(gè)線程一起殺死的，盡管執(zhí)行ps命令的時(shí)候根本看不到10002這個(gè)進(jìn)程。如果你不知道linux線程背后的故事，肯定會(huì)覺得遇到靈異事件了。

三、pthread 系列函數(shù)

（一）

功能：創(chuàng)建一個(gè)新的線程
原型 int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine)(void*), void *arg);
參數(shù)
thread:返回線程ID
attr:設(shè)置線程的屬性，attr為NULL表示使用默認(rèn)屬性
start_routine:是個(gè)函數(shù)地址，線程啟動(dòng)后要執(zhí)行的函數(shù)
arg:傳給線程啟動(dòng)函數(shù)的參數(shù)
返回值：成功返回0；失敗返回錯(cuò)誤碼

錯(cuò)誤檢查：

以前學(xué)過的系統(tǒng)函數(shù)都是成功返回0，失敗返回-1，而錯(cuò)誤號(hào)保存在全局變量errno中，而pthread庫(kù)的函數(shù)都是通過返回值返回錯(cuò)誤號(hào)，雖然每個(gè)線程也都有一個(gè)errno，但這是為了兼容其它函數(shù)接口而提供的，pthread庫(kù)本身并不使用它，通過返回值返回錯(cuò)誤碼更加清晰。由于pthread_create的錯(cuò)誤碼不保存在errno中，因此不能直接用perror(3)打印錯(cuò)誤信息，可以先用strerror(3)把錯(cuò)誤號(hào)轉(zhuǎn)換成錯(cuò)誤信息再打印。

（二）

功能：線程終止
原型 void pthread_exit(void *value_ptr);
參數(shù)
value_ptr：value_ptr不要指向一個(gè)局部變量，因?yàn)楫?dāng)其它線程得到這個(gè)返回指針時(shí)線程函數(shù)已經(jīng)退出了。
返回值：無返回值，跟進(jìn)程一樣，線程結(jié)束的時(shí)候無法返回到它的調(diào)用者（自身）

如果需要只終止某個(gè)線程而不終止整個(gè)進(jìn)程，可以有三種方法：

1、從線程函數(shù)return。這種方法對(duì)主線程不適用，從main函數(shù)return相當(dāng)于調(diào)用exit，而如果任意一個(gè)線程調(diào)用了exit或_exit，則整個(gè)進(jìn)程的所有線程都終止。

2、一個(gè)線程可以調(diào)用pthread_cancel 終止同一進(jìn)程中的另一個(gè)線程。

3、線程可以調(diào)用pthread_exit終止自己。

（三）

功能：等待線程結(jié)束
原型 int pthread_join(pthread_t thread, void **value_ptr);
參數(shù)
thread:線程ID
value_ptr:它指向一個(gè)指針，后者指向線程的返回值
返回值：成功返回0；失敗返回錯(cuò)誤碼

當(dāng)pthread_create 中的 start_routine返回時(shí)，這個(gè)線程就退出了，其它線程可以調(diào)用pthread_join得到start_routine的返回值，類似于父進(jìn)程調(diào)用wait(2)得到子進(jìn)程的退出狀態(tài)。

調(diào)用該函數(shù)的線程將掛起等待，直到id為thread的線程終止。thread線程以不同的方法終止，通過pthread_join得到的終止?fàn)顟B(tài)是不同的，總結(jié)如下：

1、如果thread線程通過return返回，value_ptr所指向的單元里存放的是thread線程函數(shù)的返回值。

2、如果thread線程被別的線程調(diào)用pthread_cancel異常終止掉，value_ptr所指向的單元里存放的是常數(shù)PTHREAD_CANCELED。

3、如果thread線程是自己調(diào)用pthread_exit終止的，value_ptr所指向的單元存放的是傳給pthread_exit的參數(shù)。

如果對(duì)thread線程的終止?fàn)顟B(tài)不感興趣，可以傳NULL給value_ptr參數(shù)。

（四）

功能：返回線程ID
原型 pthread_t pthread_self(void);
返回值：成功返回線程id

在Linux上，pthread_t類型是一個(gè)地址值，屬于同一進(jìn)程的多個(gè)線程調(diào)用getpid(2)可以得到相同的進(jìn)程號(hào)，而調(diào)用pthread_self(3)得到的線程號(hào)各不相同。線程id只在當(dāng)前進(jìn)程中保證是唯一的，在不同的系統(tǒng)中pthread_t這個(gè)類型有不同的實(shí)現(xiàn)，它可能是一個(gè)整數(shù)值，也可能是一個(gè)結(jié)構(gòu)體，也可能是一個(gè)地址，所以不能簡(jiǎn)單地當(dāng)成整數(shù)用printf打印。

（五）

功能：取消一個(gè)執(zhí)行中的線程
原型 int pthread_cancel(pthread_t thread);
參數(shù)
thread:線程ID
返回值：成功返回0；失敗返回錯(cuò)誤碼

一個(gè)新創(chuàng)建的線程默認(rèn)取消狀態(tài)（cancelability state）是可取消的，取消類型（?cancelability type）是同步的，即在某個(gè)可取消點(diǎn)（?cancellation point，即在執(zhí)行某些函數(shù)的時(shí)候）才會(huì)取消線程。具體可以man 一下。

相關(guān)函數(shù)?int pthread_setcancelstate(int state, int *oldstate); ?int pthread_setcanceltype(int type, int *oldtype); 為保證一個(gè)事務(wù)型處理邏輯的完整可以使用這兩個(gè)函數(shù)，如下舉例，主線程創(chuàng)建完線程睡眠一陣調(diào)用pthread_cancel，test是thread_function。

C++ Code?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

void?*test(void?*arg)
{
????for?(int?i?=?0;?i?<?10;?i++)
????{
????????pthread_setcancelstate(PTHREAD_CANCEL_DISABLE,?NULL);
????????printf("start:?%d;?",?i);
????????sleep(1);
????????printf("end:?%d\n",?i);
????????if?(i?>?7)
????????{
????????????pthread_setcancelstate(PTHREAD_CANCEL_ENABLE,?NULL);
????????????pthread_testcancel();
????????}
????}
????return?(void?*)0;
}

就算我們?cè)谕瓿梢淮瓮暾壿嫼蟛涣⒓锤幕?PTHREAD_CANCEL_ENABLE，就算后續(xù)循環(huán)再次調(diào)用?PTHREAD_CANCEL_DISABLE 設(shè)置，其 "未決狀態(tài)" 依然會(huì)保留的。循環(huán)執(zhí)行i=0~8 后，i=9時(shí)在sleep可取消點(diǎn)線程被中斷。

（六）

功能：將一個(gè)線程分離
原型 int pthread_detach(pthread_t thread);
參數(shù)
thread:線程ID
返回值：成功返回0；失敗返回錯(cuò)誤碼

一般情況下，線程終止后，其終止?fàn)顟B(tài)一直保留到其它線程調(diào)用pthread_join獲取它的狀態(tài)為止（僵線程）。但是線程也可以被置為detach狀態(tài)，這樣的線程一旦終止就立刻回收它占用的所有資源，而不保留終止?fàn)顟B(tài)。不能對(duì)一個(gè)已經(jīng)處于detach狀態(tài)的線程調(diào)用pthread_join，這樣的調(diào)用將返回EINVAL。對(duì)一個(gè)尚未detach的線程調(diào)用pthread_join或pthread_detach都可以把該線程置為detach狀態(tài)，也就是說，不能對(duì)同一線程調(diào)用兩次pthread_join，或者如果已經(jīng)對(duì)一個(gè)線程調(diào)用了pthread_detach就不能再調(diào)用pthread_join了。

這個(gè)函數(shù)既可以在主線程中調(diào)用，也可以在thread_function里面調(diào)用。

在主線程中通過線程屬性也可以達(dá)到同樣的效果，如下：

C++ Code?

1
2
3
4
5
6
7

pthread_attr_t?attr;
pthread_attr_init(&attr);
pthread_attr_setdetachstate(&attr,?PTHREAD_CREATE_DETACHED);
pthread_t?tid;
pthread_create(&tid,?&attr,?test,?"a");?//?test?is?thread_function
sleep(3);
pthread_attr_destroy(&attr);

下面寫個(gè)程序走一下這些函數(shù)：

C++ Code?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63

#include<stdio.h>
#include<stdlib.h>
#include<sys/ipc.h>
#include<sys/msg.h>
#include<sys/types.h>
#include<unistd.h>
#include<errno.h>
#include<pthread.h>
#include<string.h>

#define?ERR_EXIT(m)?\
????do?{?\
????????perror(m);?\
????????exit(EXIT_FAILURE);?\
????}?while(0)

void?*routine(void?*arg)
{
????int?i;
????for?(i?=?0;?i?<?20;?i++)
????{
????????printf("B");
????????fflush(stdout);
????????usleep(20);
????????/*
????????????if?(i?==?3)
????????????????pthread_exit("ABC");
????????????*/
????}
????return?"DEF";
}

int?main(void)
{
????pthread_t?tid;
????int?ret;
????if?((ret?=?pthread_create(&tid,?NULL,?routine,?NULL))?!=?0)
????{
????????fprintf(stderr,?"pthread?create:?%s\n",?strerror(ret));
????????exit(EXIT_FAILURE);
????}

????int?i;
????for?(i?=?0;?i?<?20;?i++)
????{
????????printf("A");
????????fflush(stdout);
????????usleep(20);
????}

????void?*value;
????if?((ret?=?pthread_join(tid,?&value))?!=?0)
????{
????????fprintf(stderr,?"pthread?create:?%s\n",?strerror(ret));
????????exit(EXIT_FAILURE);
????}

????printf("\n");

????printf("return?msg=%s\n",?(char?*)value);
????return?0;
}

創(chuàng)建一個(gè)線程，主線程打印A，新線程打印B，主線程調(diào)用pthread_join 等待新線程退出，打印退出值。

simba@ubuntu:~/Documents/code/linux_programming/UNP/pthread$ ./pthread_create?
ABAABABABABABABABABABABABABAABABBABABABB
return msg=DEF

在新線程中也可調(diào)用pthread_exit 退出。

四、簡(jiǎn)單的多線程服務(wù)器端程序

在將socket 編程的時(shí)候曾經(jīng)使用fork 多進(jìn)程的方式來實(shí)現(xiàn)并發(fā)，現(xiàn)在嘗試使用多線程方式來實(shí)現(xiàn)：

C++ Code?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96

#include?<unistd.h>
#include?<sys/types.h>
#include?<sys/socket.h>
#include?<netinet/in.h>
#include?<arpa/inet.h>
#include?<pthread.h>

#include?<stdlib.h>
#include?<stdio.h>
#include?<errno.h>
#include?<string.h>

#define?ERR_EXIT(m)?\
????????do?\
????????{?\
????????????????perror(m);?\
????????????????exit(EXIT_FAILURE);?\
????????}?while(0)

void?echo_srv(int?conn)
{
????char?recvbuf[1024];
????while?(1)
????{
????????memset(recvbuf,?0,?sizeof(recvbuf));
????????int?ret?=?read(conn,?recvbuf,?sizeof(recvbuf));
????????if?(ret?==?0)
????????{
????????????printf("client?close\n");
????????????break;
????????}
????????else?if?(ret?==?-1)
????????????ERR_EXIT("read");
????????fputs(recvbuf,?stdout);
????????write(conn,?recvbuf,?ret);
????} close(conn);
}

void?*thread_routine(void?*arg)
{
????/*?主線程沒有調(diào)用pthread_join等待線程退出?*/
????pthread_detach(pthread_self());?//剝離線程，避免產(chǎn)生僵線程
????/*int?conn?=?(int)arg;*/
????int?conn?=?*((int?*)arg);
????free(arg);
????echo_srv(conn);
????printf("exiting?thread?...\n");
????return?NULL;
}

int?main(void)
{
????int?listenfd;
????if?((listenfd?=?socket(PF_INET,?SOCK_STREAM,?IPPROTO_TCP))?<?0)
????????ERR_EXIT("socket");

????struct?sockaddr_in?servaddr;
????memset(&servaddr,?0,?sizeof(servaddr));
????servaddr.sin_family?=?AF_INET;
????servaddr.sin_port?=?htons(5188);
????servaddr.sin_addr.s_addr?=?htonl(INADDR_ANY);

????int?on?=?1;
????if?(setsockopt(listenfd,?SOL_SOCKET,?SO_REUSEADDR,?&on,?sizeof(on))?<?0)
????????ERR_EXIT("setsockopt");

????if?(bind(listenfd,?(struct?sockaddr?*)&servaddr,?sizeof(servaddr))?<?0)
????????ERR_EXIT("bind");
????if?(listen(listenfd,?SOMAXCONN)?<?0)
????????ERR_EXIT("listen");

????struct?sockaddr_in?peeraddr;
????socklen_t?peerlen?=?sizeof(peeraddr);
????int?conn;

????while?(1)
????{
????????if?((conn?=?accept(listenfd,?(struct?sockaddr?*)&peeraddr,?&peerlen))?<?0)
????????????ERR_EXIT("accept");

????????printf("ip=%s?port=%d\n",?inet_ntoa(peeraddr.sin_addr),?ntohs(peeraddr.sin_port));

????????pthread_t?tid;
????????//??????int?ret;
????????/*pthread_create(&tid,?NULL,?thread_routine,?(void*)&conn);*/?//?race?condition問題，竟態(tài)問題
????????int?*p?=?malloc(sizeof(int));
????????*p?=?conn;
????????pthread_create(&tid,?NULL,?thread_routine,?p);
????????/*
????????????????if?((ret?=?pthread_create(&tid,?NULL,?thread_routine,?(void*)conn))?!=?0)?//64位系統(tǒng)時(shí)指針不是4個(gè)字節(jié)，不可移植
????????????????{
????????????????????fprintf(stderr,?"pthread_create:%s\n",?strerror(ret));
????????????????????exit(EXIT_FAILURE);
????????????????}
????????*/
????}

程序邏輯并不復(fù)雜，一旦accept 返回一個(gè)已連接套接字，就創(chuàng)建一個(gè)新線程對(duì)其服務(wù)，在每個(gè)新線程thread_routine 中調(diào)用pthread_detach 剝離線程，我們的主線程不能調(diào)用pthread_join 等待這些新線程的退出，因?yàn)檫€要返回while 循環(huán)開頭去在accept 中阻塞監(jiān)聽。

如果使用pthread_create(&tid, NULL, thread_routine, (void*)&conn); 存在的問題是如果accept 再次返回一個(gè)已連接套接字，而此時(shí)thread_routine 函數(shù)還沒取走conn 時(shí)，可能會(huì)讀取到已經(jīng)被更改的conn 值。

如果使用 ?pthread_create(&tid, NULL, thread_routine, (void*)conn); 存在的問題是在64位系統(tǒng)中指針不是4個(gè)字節(jié)而是8個(gè)字節(jié)，即不可移植性。

使用上述未被注釋的做法，每次返回一個(gè)conn，就malloc 一塊內(nèi)存存放起來，在thread_routine 函數(shù)中去讀取即可。

開多個(gè)客戶端，可以看到正常服務(wù)。

后記：其實(shí) pthread 系列函數(shù)也可以應(yīng)用于進(jìn)程間加鎖，怎么應(yīng)用到多進(jìn)程場(chǎng)合呢，被多個(gè)進(jìn)程共享呢？

很簡(jiǎn)單，首先需要設(shè)置互斥鎖的進(jìn)程間共享屬性：

C++ Code?

1
2
3
4

int?pshared);
pthread_mutexattr_t?mattr;
pthread_mutexattr_init(&mattr);
pthread_mutexattr_setpshared(&mattr,?PTHREAD_PROCESS_SHARED);

其次，為了達(dá)到多進(jìn)程共享的需要，互斥鎖對(duì)象需要?jiǎng)?chuàng)建在共享內(nèi)存中。

最后，需要注意的是，并不是所有Linux系統(tǒng)都支持這個(gè)特性，程序里需要檢查是否定義了_POSIX_SHARED_MEMORY_OBJECTS宏，只有定義了才能用這種方式實(shí)現(xiàn)進(jìn)程間互斥鎖。

參考：

《linux c 編程一站式學(xué)習(xí)》

《UNP》

《APUE》

http://www.ibm.com/developerworks/cn/linux/l-cn-mthreadps/index.html

http://www.ibm.com/developerworks/cn/linux/kernel/l-thread/

Linux 的多線程編程的高效開發(fā)經(jīng)驗(yàn)

背景

Linux 平臺(tái)上的多線程程序開發(fā)相對(duì)應(yīng)其他平臺(tái)（比如 Windows）的多線程 API 有一些細(xì)微和隱晦的差別。不注意這些 Linux 上的一些開發(fā)陷阱，常常會(huì)導(dǎo)致程序問題不窮，死鎖不斷。本文中我們從 5 個(gè)方面總結(jié)出 Linux 多線程編程上的問題，并分別引出相關(guān)改善的開發(fā)經(jīng)驗(yàn)，用以避免這些的陷阱。我們希望這些經(jīng)驗(yàn)可以幫助讀者們能更好更快的熟悉 Linux 平臺(tái)的多線程編程。

我們假設(shè)讀者都已經(jīng)很熟悉 Linux 平臺(tái)上基本的線程編程的 Pthread 庫(kù) API 。其他的第三方用以線程編程的庫(kù)，如 boost，將不會(huì)在本文中提及。本文中主要涉及的題材包括線程開發(fā)中的線程管理，互斥變量，條件變量等。進(jìn)程概念將不會(huì)在本文中涉及。

Linux 上線程開發(fā) API 的概要介紹

多線程開發(fā)在 Linux 平臺(tái)上已經(jīng)有成熟的 Pthread 庫(kù)支持。其涉及的多線程開發(fā)的最基本概念主要包含三點(diǎn)：線程，互斥鎖，條件。其中，線程操作又分線程的創(chuàng)建，退出，等待 3 種。互斥鎖則包括 4 種操作，分別是創(chuàng)建，銷毀，加鎖和解鎖。條件操作有 5 種操作：創(chuàng)建，銷毀，觸發(fā)，廣播和等待。其他的一些線程擴(kuò)展概念，如信號(hào)燈等，都可以通過上面的三個(gè)基本元素的基本操作封裝出來。

線程，互斥鎖，條件在 Linux 平臺(tái)上對(duì)應(yīng)的 API 可以用表 1 歸納。為了方便熟悉 Windows 線程編程的讀者熟悉 Linux 多線程開發(fā)的 API，我們?cè)诒碇型瑫r(shí)也列出 Windows SDK 庫(kù)中所對(duì)應(yīng)的 API 名稱。

表 1. 線程函數(shù)列表

對(duì)象操作Linux Pthread APIWindows SDK 庫(kù)對(duì)應(yīng) API

線程	創(chuàng)建	pthread_create	CreateThread
	退出	pthread_exit	ThreadExit
	等待	pthread_join	WaitForSingleObject
互斥鎖	創(chuàng)建	pthread_mutex_init	CreateMutex
	銷毀	pthread_mutex_destroy	CloseHandle
	加鎖	pthread_mutex_lock	WaitForSingleObject
	解鎖	pthread_mutex_unlock	ReleaseMutex
條件	創(chuàng)建	pthread_cond_init	CreateEvent
	銷毀	pthread_cond_destroy	CloseHandle
	觸發(fā)	pthread_cond_signal	SetEvent
	廣播	pthread_cond_broadcast	SetEvent / ResetEvent
	等待	pthread_cond_wait / pthread_cond_timedwait	SingleObjectAndWait

Linux 線程編程中的 5 條經(jīng)驗(yàn)

盡量設(shè)置 recursive 屬性以初始化 Linux 的互斥變量

互斥鎖是多線程編程中基本的概念，在開發(fā)中被廣泛使用。其調(diào)用次序?qū)哟吻逦?jiǎn)單：建鎖，加鎖，解鎖，銷毀鎖。但是需要注意的是，與諸如 Windows 平臺(tái)的互斥變量不同，在默認(rèn)情況下，Linux 下的同一線程無法對(duì)同一互斥鎖進(jìn)行遞歸加速，否則將發(fā)生死鎖。

所謂遞歸加鎖，就是在同一線程中試圖對(duì)互斥鎖進(jìn)行兩次或兩次以上的行為。其場(chǎng)景在 Linux 平臺(tái)上的代碼可由清單 1 所示。

清單 1. Linux 重復(fù)對(duì)互斥鎖加鎖實(shí)例

// 通過默認(rèn)條件建鎖 ????pthread_mutex_t *theMutex = new pthread_mutex_t; ????pthread_mutexattr_t attr; ????pthread_mutexattr_init(&attr); ????pthread_mutex_init(theMutex,&attr); ????pthread_mutexattr_destroy(&attr); ????// 遞歸加鎖 ????pthread_mutex_lock (theMutex); ????pthread_mutex_lock (theMutex); ????pthread_mutex_unlock (theMutex); ????pthread_mutex_unlock (theMutex);

在以上代碼場(chǎng)景中，問題將出現(xiàn)在第二次加鎖操作。由于在默認(rèn)情況下，Linux 不允許同一線程遞歸加鎖，因此在第二次加鎖操作時(shí)線程將出現(xiàn)死鎖。

Linux 互斥變量這種奇怪的行為或許對(duì)于特定的某些場(chǎng)景會(huì)所有用處，但是對(duì)于大多數(shù)情況下看起來更像是程序的一個(gè) bug 。畢竟，在同一線程中對(duì)同一互斥鎖進(jìn)行遞歸加鎖在尤其是二次開發(fā)中經(jīng)常會(huì)需要。

這個(gè)問題與互斥鎖的中的默認(rèn) recursive 屬性有關(guān)。解決問題的方法就是顯式地在互斥變量初始化時(shí)將設(shè)置起 recursive 屬性。基于此，以上代碼其實(shí)稍作修改就可以很好的運(yùn)行，只需要在初始化鎖的時(shí)候加設(shè)置一個(gè)屬性。請(qǐng)看清單 2 。

清單 2. 設(shè)置互斥鎖 recursive 屬性實(shí)例

pthread_mutexattr_init(&attr); ????// 設(shè)置 recursive 屬性 ????pthread_mutexattr_settype(&attr,PTHREAD_MUTEX_RECURSIVE_NP); ????pthread_mutex_init(theMutex,&attr);

因此，建議盡量設(shè)置 recursive 屬性以初始化 Linux 的互斥鎖，這樣既可以解決同一線程遞歸加鎖的問題，又可以避免很多情況下死鎖的發(fā)生。這樣做還有一個(gè)額外的好處，就是可以讓 Windows 和 Linux 下讓鎖的表現(xiàn)統(tǒng)一。

注意 Linux 平臺(tái)上觸發(fā)條件變量的自動(dòng)復(fù)位問題

條件變量的置位和復(fù)位有兩種常用模型：第一種模型是當(dāng)條件變量置位（signaled）以后，如果當(dāng)前沒有線程在等待，其狀態(tài)會(huì)保持為置位（signaled），直到有等待的線程進(jìn)入被觸發(fā)，其狀態(tài)才會(huì)變?yōu)閺?fù)位（unsignaled），這種模型的采用以 Windows 平臺(tái)上的 Auto-set Event 為代表。其狀態(tài)變化如圖 1 所示：

圖 1. Windows 的條件變量狀態(tài)變化流程

第二種模型則是 Linux 平臺(tái)的 Pthread 所采用的模型，當(dāng)條件變量置位（signaled）以后，即使當(dāng)前沒有任何線程在等待，其狀態(tài)也會(huì)恢復(fù)為復(fù)位（unsignaled）狀態(tài)。其狀態(tài)變化如圖 2 所示：

圖 2. Linux 的條件變量狀態(tài)變化流程

具體來說，Linux 平臺(tái)上 Pthread 下的條件變量狀態(tài)變化模型是這樣工作的：調(diào)用 pthread_cond_signal() 釋放被條件阻塞的線程時(shí)，無論存不存在被阻塞的線程，條件都將被重新復(fù)位，下一個(gè)被條件阻塞的線程將不受影響。而對(duì)于 Windows，當(dāng)調(diào)用 SetEvent 觸發(fā) Auto-reset 的 Event 條件時(shí)，如果沒有被條件阻塞的線程，那么條件將維持在觸發(fā)狀態(tài)，直到有新的線程被條件阻塞并被釋放為止。

這種差異性對(duì)于那些熟悉 Windows 平臺(tái)上的條件變量狀態(tài)模型而要開發(fā) Linux 平臺(tái)上多線程的程序員來說可能會(huì)造成意想不到的尷尬結(jié)果。試想要實(shí)現(xiàn)一個(gè)旅客坐出租車的程序：旅客在路邊等出租車，調(diào)用條件等待。出租車來了，將觸發(fā)條件，旅客停止等待并上車。一個(gè)出租車只能搭載一波乘客，于是我們使用單一觸發(fā)的條件變量。這個(gè)實(shí)現(xiàn)邏輯在第一個(gè)模型下即使出租車先到，也不會(huì)有什么問題，其過程如圖 3 所示：

圖 3. 采用 Windows 條件變量模型的出租車實(shí)例流程

然而如果按照這個(gè)思路來在 Linux 上來實(shí)現(xiàn)，代碼看起來可能是清單 3 這樣。

清單 3. Linux 出租車案例代碼實(shí)例

…… ?// 提示出租車到達(dá)的條件變量 ?pthread_cond_t taxiCond; ?// 同步鎖 ?pthread_mutex_t taxiMutex; ?// 旅客到達(dá)等待出租車 ?void * traveler_arrive(void * name) { ????cout<< ” Traveler: ” <<(char *)name<< ” needs a taxi now! ” <<endl; ????pthread_mutex_lock(&taxiMutex); ????pthread_cond_wait (&taxiCond, &taxtMutex); ????pthread_mutex_unlock (&taxtMutex); ????cout<< ” Traveler: ” << (char *)name << ” now got a taxi! ” <<endl; ????pthread_exit( (void *)0 ); ?} ?// 出租車到達(dá) ?void * taxi_arrive(void *name) { ????cout<< ” Taxi ” <<(char *)name<< ” arrives. ” <<endl; ????pthread_cond_signal(&taxtCond); ????pthread_exit( (void *)0 ); ?} ?void main() {? ????// 初始化 ????taxtCond= PTHREAD_COND_INITIALIZER; ????taxtMutex= PTHREAD_MUTEX_INITIALIZER; ????pthread_t thread; ????pthread_attr_t threadAttr; ????pthread_attr_init(&threadAttr); ????pthread_create(&thread, & threadAttr, taxt_arrive, (void *)( ” Jack ” )); ????sleep(1); ????pthread_create(&thread, &threadAttr, traveler_arrive, (void *)( ” Susan ” )); ????sleep(1); ????pthread_create(&thread, &threadAttr, taxi_arrive, (void *)( ” Mike ” )); ????sleep(1); ????return 0; ?}

好的，運(yùn)行一下，看看結(jié)果如清單 4 。

清單 4. 程序結(jié)果輸出

Taxi Jack arrives. ????Traveler Susan needs a taxi now! ????Taxi Mike arrives. ????Traveler Susan now got a taxi.

其過程如圖 4 所示：

圖 4. 采用 Linux 條件變量模型的出租車實(shí)例流程

通過對(duì)比結(jié)果，你會(huì)發(fā)現(xiàn)同樣的邏輯，在 Linux 平臺(tái)上運(yùn)行的結(jié)果卻完全是兩樣。對(duì)于在 Windows 平臺(tái)上的模型一， Jack 開著出租車到了站臺(tái)，觸發(fā)條件變量。如果沒顧客，條件變量將維持觸發(fā)狀態(tài)，也就是說 Jack 停下車在那里等著。直到 Susan 小姐來了站臺(tái)，執(zhí)行等待條件來找出租車。 Susan 搭上 Jack 的出租車離開，同時(shí)條件變量被自動(dòng)復(fù)位。

但是到了 Linux 平臺(tái)，問題就來了，Jack 到了站臺(tái)一看沒人，觸發(fā)的條件變量被直接復(fù)位，于是 Jack 排在等待隊(duì)列里面。來遲一秒的 Susan 小姐到了站臺(tái)卻看不到在那里等待的 Jack，只能等待，直到 Mike 開車趕到，重新觸發(fā)條件變量，Susan 才上了 Mike 的車。這對(duì)于在排隊(duì)系統(tǒng)前面的 Jack 是不公平的，而問題癥結(jié)是在于 Linux 平臺(tái)上條件變量觸發(fā)的自動(dòng)復(fù)位引起的一個(gè) Bug 。

條件變量在 Linux 平臺(tái)上的這種模型很難說好壞。但是在實(shí)際開發(fā)中，我們可以對(duì)代碼稍加改進(jìn)就可以避免這種差異的發(fā)生。由于這種差異只發(fā)生在觸發(fā)沒有被線程等待在條件變量的時(shí)刻，因此我們只需要掌握好觸發(fā)的時(shí)機(jī)即可。最簡(jiǎn)單的做法是增加一個(gè)計(jì)數(shù)器記錄等待線程的個(gè)數(shù)，在決定觸發(fā)條件變量前檢查下該變量即可。改進(jìn)后 Linux 函數(shù)如清單 5 所示。

清單 5. Linux 出租車案例代碼實(shí)例

…… ?// 提示出租車到達(dá)的條件變量 ?pthread_cond_t taxiCond; ?// 同步鎖 ?pthread_mutex_t taxiMutex; ?// 旅客人數(shù)，初始為 0 ?int travelerCount=0; ?// 旅客到達(dá)等待出租車 ?void * traveler_arrive(void * name) { ????cout<< ” Traveler: ” <<(char *)name<< ” needs a taxi now! ” <<endl; ????pthread_mutex_lock(&taxiMutex); ????// 提示旅客人數(shù)增加 ????travelerCount++; ????pthread_cond_wait (&taxiCond, &taxiMutex); ????pthread_mutex_unlock (&taxiMutex); ????cout<< ” Traveler: ” << (char *)name << ” now got a taxi! ” <<endl; ????pthread_exit( (void *)0 ); ?} ?// 出租車到達(dá) ?void * taxi_arrive(void *name) ?{ ????cout<< ” Taxi ” <<(char *)name<< ” arrives. ” <<endl; ?while(true) ?{ ????????pthread_mutex_lock(&taxiMutex); ????????// 當(dāng)發(fā)現(xiàn)已經(jīng)有旅客在等待時(shí)，才觸發(fā)條件變量 ????????if(travelerCount>0) ????????{ ????????????pthread_cond_signal(&taxtCond); ????????????pthread_mutex_unlock (&taxiMutex); ????????????break; ????????} ????????pthread_mutex_unlock (&taxiMutex); ????} ????pthread_exit( (void *)0 ); ?}

因此我們建議在 Linux 平臺(tái)上要出發(fā)條件變量之前要檢查是否有等待的線程，只有當(dāng)有線程在等待時(shí)才對(duì)條件變量進(jìn)行觸發(fā)。

注意條件返回時(shí)互斥鎖的解鎖問題

在 Linux 調(diào)用 pthread_cond_wait 進(jìn)行條件變量等待操作時(shí)，我們?cè)黾右粋€(gè)互斥變量參數(shù)是必要的，這是為了避免線程間的競(jìng)爭(zhēng)和饑餓情況。但是當(dāng)條件等待返回時(shí)候，需要注意的是一定不要遺漏對(duì)互斥變量進(jìn)行解鎖。

Linux 平臺(tái)上的 pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex) 函數(shù)返回時(shí)，互斥鎖 mutex 將處于鎖定狀態(tài)。因此之后如果需要對(duì)臨界區(qū)數(shù)據(jù)進(jìn)行重新訪問，則沒有必要對(duì) mutex 就行重新加鎖。但是，隨之而來的問題是，每次條件等待以后需要加入一步手動(dòng)的解鎖操作。正如前文中乘客等待出租車的 Linux 代碼如清單 6 所示：

清單 6. 條件變量返回后的解鎖實(shí)例

void * traveler_arrive(void * name) { ????cout<< ” Traveler: ” <<(char *)name<< ” needs a taxi now! ” <<endl; ????pthread_mutex_lock(&taxiMutex); ????pthread_cond_wait (&taxiCond, &taxtMutex); ????pthread_mutex_unlock (&taxtMutex); ????cout<< ” Traveler: ” << (char *)name << ” now got a taxi! ” <<endl; ????pthread_exit( (void *)0 ); ?}

這一點(diǎn)對(duì)于熟悉 Windows 平臺(tái)多線程開發(fā)的開發(fā)者來說尤為重要。 Windows 上的 SignalObjectAndWait() 函數(shù)是常與 Linux 平臺(tái)上的 pthread_cond_wait() 函數(shù)被看作是跨平臺(tái)編程時(shí)的一對(duì)等價(jià)函數(shù)。但是需要注意的是，兩個(gè)函數(shù)退出時(shí)的狀態(tài)是不一樣的。在 Windows 平臺(tái)上，SignalObjectAndWait(HANDLE a, HANDLE b, …… ) 方法在調(diào)用結(jié)束返回時(shí)的狀態(tài)是 a 和 b 都是置位（signaled）狀態(tài)，在普遍的使用方法中，a 經(jīng)常是一個(gè) Mutex 變量，在這種情況下，當(dāng)返回時(shí)，Mutex a 處于解鎖狀態(tài)（signaled），Event b 處于置位狀態(tài)（signaled）, 因此，對(duì)于 Mutex a 而言，我們不需要考慮解鎖的問題。而且，在 SignalObjectAndWait() 之后，如果需要對(duì)臨界區(qū)數(shù)據(jù)進(jìn)行重新訪問，都需要調(diào)用 WaitForSingleObject() 重新加鎖。這一點(diǎn)剛好與 Linux 下的 pthread_cond_wait() 完全相反。

Linux 對(duì)于 Windows 的這一點(diǎn)額外解鎖的操作區(qū)別很重要，一定得牢記。否則從 Windows 移植到 Linux 上的條件等待操作一旦忘了結(jié)束后的解鎖操作，程序?qū)⒖隙〞?huì)發(fā)生死鎖。

等待的絕對(duì)時(shí)間問題

超時(shí)是多線程編程中一個(gè)常見的概念。例如，當(dāng)你在 Linux 平臺(tái)下使用 pthread_cond_timedwait() 時(shí)就需要指定超時(shí)這個(gè)參數(shù)，以便這個(gè) API 的調(diào)用者最多只被阻塞指定的時(shí)間間隔。但是如果你是第一次使用這個(gè) API 時(shí)，首先你需要了解的就是這個(gè) API 當(dāng)中超時(shí)參數(shù)的特殊性（就如本節(jié)標(biāo)題所提示的那樣）。我們首先來看一下這個(gè) API 的定義。 pthread_cond_timedwait() 定義請(qǐng)看清單 7 。

清單 7. pthread_cond_timedwait() 函數(shù)定義

int pthread_cond_timedwait(pthread_cond_t *restrict cond, ??????????????pthread_mutex_t *restrict mutex, ??????????????const struct timespec *restrict abstime);

參數(shù) abstime 在這里用來表示和超時(shí)時(shí)間相關(guān)的一個(gè)參數(shù)，但是需要注意的是它所表示的是一個(gè)絕對(duì)時(shí)間，而不是一個(gè)時(shí)間間隔數(shù)值，只有當(dāng)系統(tǒng)的當(dāng)前時(shí)間達(dá)到或者超過 abstime 所表示的時(shí)間時(shí)，才會(huì)觸發(fā)超時(shí)事件。這對(duì)于擁有 Windows 平臺(tái)線程開發(fā)經(jīng)驗(yàn)的人來說可能尤為困惑。因?yàn)?Windows 平臺(tái)下所有的 API 等待參數(shù)（如 SignalObjectAndWait，等）都是相對(duì)時(shí)間，

假設(shè)我們指定相對(duì)的超時(shí)時(shí)間參數(shù)如 dwMilliseconds （單位毫秒）來調(diào)用和超時(shí)相關(guān)的函數(shù)，這樣就需要將 dwMilliseconds 轉(zhuǎn)化為 Linux 下的絕對(duì)時(shí)間參數(shù) abstime 使用。常用的轉(zhuǎn)換方法如清單 8 所示：

清單 8. 相對(duì)時(shí)間到絕對(duì)時(shí)間轉(zhuǎn)換實(shí)例

/* get the current time */ ????struct timeval now; ????gettimeofday(&now, NULL); ????? ????/* add the offset to get timeout value */ ????abstime ->tv_nsec = now.tv_usec * 1000 + (dwMilliseconds % 1000) * 1000000; ????abstime ->tv_sec = now.tv_sec + dwMilliseconds / 1000;

Linux 的絕對(duì)時(shí)間看似簡(jiǎn)單明了，卻是開發(fā)中一個(gè)非常隱晦的陷阱。而且一旦你忘了時(shí)間轉(zhuǎn)換，可以想象，等待你的錯(cuò)誤將是多么的令人頭疼：如果忘了把相對(duì)時(shí)間轉(zhuǎn)換成絕對(duì)時(shí)間，相當(dāng)于你告訴系統(tǒng)你所等待的超時(shí)時(shí)間是過去式的 1970 年 1 月 1 號(hào)某個(gè)時(shí)間段，于是操作系統(tǒng)毫不猶豫馬上送給你一個(gè) timeout 的返回值，然后你會(huì)舉著拳頭抱怨為什么另外一個(gè)同步線程耗時(shí)居然如此之久，并一頭扎進(jìn)尋找耗時(shí)原因的深淵里。

正確處理 Linux 平臺(tái)下的線程結(jié)束問題

在 Linux 平臺(tái)下，當(dāng)處理線程結(jié)束時(shí)需要注意的一個(gè)問題就是如何讓一個(gè)線程善始善終，讓其所占資源得到正確釋放。在 Linux 平臺(tái)默認(rèn)情況下，雖然各個(gè)線程之間是相互獨(dú)立的，一個(gè)線程的終止不會(huì)去通知或影響其他的線程。但是已經(jīng)終止的線程的資源并不會(huì)隨著線程的終止而得到釋放，我們需要調(diào)用 pthread_join() 來獲得另一個(gè)線程的終止?fàn)顟B(tài)并且釋放該線程所占的資源。 Pthread_join() 函數(shù)的定義如清單 9 。

清單 9. pthread_join 函數(shù)定義

int pthread_join(pthread_t th, void **thread_return);

調(diào)用該函數(shù)的線程將掛起，等待 th 所表示的線程的結(jié)束。 thread_return 是指向線程 th 返回值的指針。需要注意的是 th 所表示的線程必須是 joinable 的，即處于非 detached（游離）狀態(tài)；并且只可以有唯一的一個(gè)線程對(duì) th 調(diào)用 pthread_join() 。如果 th 處于 detached 狀態(tài)，那么對(duì) th 的 pthread_join() 調(diào)用將返回錯(cuò)誤。

如果你壓根兒不關(guān)心一個(gè)線程的結(jié)束狀態(tài)，那么也可以將一個(gè)線程設(shè)置為 detached 狀態(tài)，從而來讓操作系統(tǒng)在該線程結(jié)束時(shí)來回收它所占的資源。將一個(gè)線程設(shè)置為 detached 狀態(tài)可以通過兩種方式來實(shí)現(xiàn)。一種是調(diào)用 pthread_detach() 函數(shù)，可以將線程 th 設(shè)置為 detached 狀態(tài)。其申明如清單 10 。

清單 10. pthread_detach 函數(shù)定義

int pthread_detach(pthread_t th);

另一種方法是在創(chuàng)建線程時(shí)就將它設(shè)置為 detached 狀態(tài)，首先初始化一個(gè)線程屬性變量，然后將其設(shè)置為 detached 狀態(tài)，最后將它作為參數(shù)傳入線程創(chuàng)建函數(shù) pthread_create()，這樣所創(chuàng)建出來的線程就直接處于 detached 狀態(tài)。方法如清單 11 。

清單 11. 創(chuàng)建 detach 線程代碼實(shí)例

………………………………… .. ????pthread_t?????? tid; ????pthread_attr_t? attr; ????pthread_attr_init(&attr); ????pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED); ????pthread_create(&tid, &attr, THREAD_FUNCTION, arg);

總之為了在使用 Pthread 時(shí)避免線程的資源在線程結(jié)束時(shí)不能得到正確釋放，從而避免產(chǎn)生潛在的內(nèi)存泄漏問題，在對(duì)待線程結(jié)束時(shí)，要確保該線程處于 detached 狀態(tài)，否著就需要調(diào)用 pthread_join() 函數(shù)來對(duì)其進(jìn)行資源回收。

總結(jié)與補(bǔ)充

本文以上部分詳細(xì)介紹了 Linux 的多線程編程的 5 條高效開發(fā)經(jīng)驗(yàn)。另外你也可以考慮嘗試其他一些開源類庫(kù)來進(jìn)行線程開發(fā)。

1. Boost 庫(kù)

Boost 庫(kù)來自于由 C++ 標(biāo)準(zhǔn)委員會(huì)類庫(kù)工作組成員發(fā)起，致力于為 C++ 開發(fā)新的類庫(kù)的 Boost 組織。雖然該庫(kù)本身并不是針對(duì)多線程而產(chǎn)生，但是發(fā)展至今，其已提供了比較全面的多線程編程的 API 支持。 Boost 庫(kù)對(duì)于多線程支持的 API 風(fēng)格上更類似于 Linux 的 Pthread 庫(kù)，差別在于其將線程，互斥鎖，條件等線程開發(fā)概念都封裝成了 C++ 類，以方便開發(fā)調(diào)用。 Boost 庫(kù)目前對(duì)跨平臺(tái)支持的很不錯(cuò)，不僅支持 Windows 和 Linux ，還支持各種商用的 Unix 版本。如果開發(fā)者想使用高穩(wěn)定性的統(tǒng)一線程編程接口減輕跨平臺(tái)開發(fā)的難度， Boost 庫(kù)將是首選。

2. ACE

ACE 全稱是 ADAPTIVE Communication Environment，它是一個(gè)免費(fèi)的，開源的，面向?qū)ο蟮墓ぞ呖蚣?#xff0c;用以開發(fā)并發(fā)訪問的軟件。由于 ACE 最初是面向網(wǎng)絡(luò)服務(wù)端的編程開發(fā)，因此對(duì)于線程開發(fā)的工具庫(kù)它也能提供很全面的支持。其支持的平臺(tái)也很全面，包括 Windows，Linux 和各種版本 Unix 。 ACE 的唯一問題是如果僅僅是用于線程編程，其似乎顯得有些過于重量級(jí)。而且其較復(fù)雜的配置也讓其部署對(duì)初學(xué)者而言并非易事。

Linux 線程實(shí)現(xiàn)機(jī)制分析

一.基礎(chǔ)知識(shí)：線程和進(jìn)程

按照教科書上的定義，進(jìn)程是資源管理的最小單位，線程是程序執(zhí)行的最小單位。在操作系統(tǒng)設(shè)計(jì)上，從進(jìn)程演化出線程，最主要的目的就是更好的支持SMP以及減小（進(jìn)程/線程）上下文切換開銷。

無論按照怎樣的分法，一個(gè)進(jìn)程至少需要一個(gè)線程作為它的指令執(zhí)行體，進(jìn)程管理著資源（比如cpu、內(nèi)存、文件等等），而將線程分配到某個(gè)cpu上執(zhí)行。一個(gè)進(jìn)程當(dāng)然可以擁有多個(gè)線程，此時(shí)，如果進(jìn)程運(yùn)行在SMP機(jī)器上，它就可以同時(shí)使用多個(gè)cpu來執(zhí)行各個(gè)線程，達(dá)到最大程度的并行，以提高效率；同時(shí)，即使是在單cpu的機(jī)器上，采用多線程模型來設(shè)計(jì)程序，正如當(dāng)年采用多進(jìn)程模型代替單進(jìn)程模型一樣，使設(shè)計(jì)更簡(jiǎn)潔、功能更完備，程序的執(zhí)行效率也更高，例如采用多個(gè)線程響應(yīng)多個(gè)輸入，而此時(shí)多線程模型所實(shí)現(xiàn)的功能實(shí)際上也可以用多進(jìn)程模型來實(shí)現(xiàn)，而與后者相比，線程的上下文切換開銷就比進(jìn)程要小多了，從語義上來說，同時(shí)響應(yīng)多個(gè)輸入這樣的功能，實(shí)際上就是共享了除cpu以外的所有資源的。

針對(duì)線程模型的兩大意義，分別開發(fā)出了核心級(jí)線程和用戶級(jí)線程兩種線程模型，分類的標(biāo)準(zhǔn)主要是線程的調(diào)度者在核內(nèi)還是在核外。前者更利于并發(fā)使用多處理器的資源，而后者則更多考慮的是上下文切換開銷。在目前的商用系統(tǒng)中，通常都將兩者結(jié)合起來使用，既提供核心線程以滿足smp系統(tǒng)的需要，也支持用線程庫(kù)的方式在用戶態(tài)實(shí)現(xiàn)另一套線程機(jī)制，此時(shí)一個(gè)核心線程同時(shí)成為多個(gè)用戶態(tài)線程的調(diào)度者。正如很多技術(shù)一樣，"混合"通常都能帶來更高的效率，但同時(shí)也帶來更大的實(shí)現(xiàn)難度，出于"簡(jiǎn)單"的設(shè)計(jì)思路，Linux從一開始就沒有實(shí)現(xiàn)混合模型的計(jì)劃，但它在實(shí)現(xiàn)上采用了另一種思路的"混合"。

在線程機(jī)制的具體實(shí)現(xiàn)上，可以在操作系統(tǒng)內(nèi)核上實(shí)現(xiàn)線程，也可以在核外實(shí)現(xiàn)，后者顯然要求核內(nèi)至少實(shí)現(xiàn)了進(jìn)程，而前者則一般要求在核內(nèi)同時(shí)也支持進(jìn)程。核心級(jí)線程模型顯然要求前者的支持，而用戶級(jí)線程模型則不一定基于后者實(shí)現(xiàn)。這種差異，正如前所述，是兩種分類方式的標(biāo)準(zhǔn)不同帶來的。

當(dāng)核內(nèi)既支持進(jìn)程也支持線程時(shí)，就可以實(shí)現(xiàn)線程-進(jìn)程的"多對(duì)多"模型，即一個(gè)進(jìn)程的某個(gè)線程由核內(nèi)調(diào)度，而同時(shí)它也可以作為用戶級(jí)線程池的調(diào)度者，選擇合適的用戶級(jí)線程在其空間中運(yùn)行。這就是前面提到的"混合"線程模型，既可滿足多處理機(jī)系統(tǒng)的需要，也可以最大限度的減小調(diào)度開銷。絕大多數(shù)商業(yè)操作系統(tǒng)（如Digital Unix、Solaris、Irix）都采用的這種能夠完全實(shí)現(xiàn)POSIX1003.1c標(biāo)準(zhǔn)的線程模型。在核外實(shí)現(xiàn)的線程又可以分為"一對(duì)一"、"多對(duì)一"兩種模型，前者用一個(gè)核心進(jìn)程（也許是輕量進(jìn)程）對(duì)應(yīng)一個(gè)線程，將線程調(diào)度等同于進(jìn)程調(diào)度，交給核心完成，而后者則完全在核外實(shí)現(xiàn)多線程，調(diào)度也在用戶態(tài)完成。后者就是前面提到的單純的用戶級(jí)線程模型的實(shí)現(xiàn)方式，顯然，這種核外的線程調(diào)度器實(shí)際上只需要完成線程運(yùn)行棧的切換，調(diào)度開銷非常小，但同時(shí)因?yàn)楹诵男盘?hào)（無論是同步的還是異步的）都是以進(jìn)程為單位的，因而無法定位到線程，所以這種實(shí)現(xiàn)方式不能用于多處理器系統(tǒng)，而這個(gè)需求正變得越來越大，因此，在現(xiàn)實(shí)中，純用戶級(jí)線程的實(shí)現(xiàn)，除算法研究目的以外，幾乎已經(jīng)消失了。

Linux內(nèi)核只提供了輕量進(jìn)程的支持，限制了更高效的線程模型的實(shí)現(xiàn)，但Linux著重優(yōu)化了進(jìn)程的調(diào)度開銷，一定程度上也彌補(bǔ)了這一缺陷。目前最流行的線程機(jī)制LinuxThreads所采用的就是線程-進(jìn)程"一對(duì)一"模型，調(diào)度交給核心，而在用戶級(jí)實(shí)現(xiàn)一個(gè)包括信號(hào)處理在內(nèi)的線程管理機(jī)制。Linux-LinuxThreads的運(yùn)行機(jī)制正是本文的描述重點(diǎn)。

二.Linux 2.4內(nèi)核中的輕量進(jìn)程實(shí)現(xiàn)

最初的進(jìn)程定義都包含程序、資源及其執(zhí)行三部分，其中程序通常指代碼，資源在操作系統(tǒng)層面上通常包括內(nèi)存資源、IO資源、信號(hào)處理等部分，而程序的執(zhí)行通常理解為執(zhí)行上下文，包括對(duì)cpu的占用，后來發(fā)展為線程。在線程概念出現(xiàn)以前，為了減小進(jìn)程切換的開銷，操作系統(tǒng)設(shè)計(jì)者逐漸修正進(jìn)程的概念，逐漸允許將進(jìn)程所占有的資源從其主體剝離出來，允許某些進(jìn)程共享一部分資源，例如文件、信號(hào)，數(shù)據(jù)內(nèi)存，甚至代碼，這就發(fā)展出輕量進(jìn)程的概念。Linux內(nèi)核在2.0.x版本就已經(jīng)實(shí)現(xiàn)了輕量進(jìn)程，應(yīng)用程序可以通過一個(gè)統(tǒng)一的clone()系統(tǒng)調(diào)用接口，用不同的參數(shù)指定創(chuàng)建輕量進(jìn)程還是普通進(jìn)程。在內(nèi)核中，clone()調(diào)用經(jīng)過參數(shù)傳遞和解釋后會(huì)調(diào)用do_fork()，這個(gè)核內(nèi)函數(shù)同時(shí)也是fork()、vfork()系統(tǒng)調(diào)用的最終實(shí)現(xiàn)：

<linux-2.4.20/kernel/fork.c> int do_fork(unsigned long clone_flags, unsigned long stack_start, struct pt_regs *regs, unsigned long stack_size)

其中的clone_flags取自以下宏的"或"值：

<linux-2.4.20/include/linux/sched.h> #define CSIGNAL????? 0x000000ff? /* signal mask to be sent at exit */ #define CLONE_VM??? 0x00000100 /* set if VM shared between processes */ #define CLONE_FS??????? 0x00000200? /* set if fs info shared between processes */ #define CLONE_FILES???? 0x00000400? /* set if open files shared between processes */ #define CLONE_SIGHAND? 0x00000800 /* set if signal handlers and blocked signals shared */ #define CLONE_PID??? 0x00001000? /* set if pid shared */ #define CLONE_PTRACE? 0x00002000? /* set if we want to let tracing continue on the child too */ #define CLONE_VFORK? 0x00004000? /* set if the parent wants the child to wake it up on mm_release */ #define CLONE_PARENT? 0x00008000? /* set if we want to have the same parent as the cloner */ #define CLONE_THREAD? 0x00010000? /* Same thread group? */ #define CLONE_NEWNS? 0x00020000? /* New namespace group? */ #define CLONE_SIGNAL?? (CLONE_SIGHAND | CLONE_THREAD)

在do_fork()中，不同的clone_flags將導(dǎo)致不同的行為，對(duì)于LinuxThreads，它使用（CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGHAND）參數(shù)來調(diào)用clone()創(chuàng)建"線程"，表示共享內(nèi)存、共享文件系統(tǒng)訪問計(jì)數(shù)、共享文件描述符表，以及共享信號(hào)處理方式。本節(jié)就針對(duì)這幾個(gè)參數(shù)，看看Linux內(nèi)核是如何實(shí)現(xiàn)這些資源的共享的。

1.CLONE_VM

do_fork()需要調(diào)用copy_mm()來設(shè)置task_struct中的mm和active_mm項(xiàng)，這兩個(gè)mm_struct數(shù)據(jù)與進(jìn)程所關(guān)聯(lián)的內(nèi)存空間相對(duì)應(yīng)。如果do_fork()時(shí)指定了CLONE_VM開關(guān)，copy_mm()將把新的task_struct中的mm和active_mm設(shè)置成與current的相同，同時(shí)提高該mm_struct的使用者數(shù)目（mm_struct::mm_users）。也就是說，輕量級(jí)進(jìn)程與父進(jìn)程共享內(nèi)存地址空間，由下圖示意可以看出mm_struct在進(jìn)程中的地位：

2.CLONE_FS

task_struct中利用fs（struct fs_struct *）記錄了進(jìn)程所在文件系統(tǒng)的根目錄和當(dāng)前目錄信息，do_fork()時(shí)調(diào)用copy_fs()復(fù)制了這個(gè)結(jié)構(gòu)；而對(duì)于輕量級(jí)進(jìn)程則僅增加fs->count計(jì)數(shù)，與父進(jìn)程共享相同的fs_struct。也就是說，輕量級(jí)進(jìn)程沒有獨(dú)立的文件系統(tǒng)相關(guān)的信息，進(jìn)程中任何一個(gè)線程改變當(dāng)前目錄、根目錄等信息都將直接影響到其他線程。

3.CLONE_FILES

一個(gè)進(jìn)程可能打開了一些文件，在進(jìn)程結(jié)構(gòu)task_struct中利用files（struct files_struct *）來保存進(jìn)程打開的文件結(jié)構(gòu)（struct file）信息，do_fork()中調(diào)用了copy_files()來處理這個(gè)進(jìn)程屬性；輕量級(jí)進(jìn)程與父進(jìn)程是共享該結(jié)構(gòu)的，copy_files()時(shí)僅增加files->count計(jì)數(shù)。這一共享使得任何線程都能訪問進(jìn)程所維護(hù)的打開文件，對(duì)它們的操作會(huì)直接反映到進(jìn)程中的其他線程。

4.CLONE_SIGHAND

每一個(gè)Linux進(jìn)程都可以自行定義對(duì)信號(hào)的處理方式，在task_struct中的sig（struct signal_struct）中使用一個(gè)struct k_sigaction結(jié)構(gòu)的數(shù)組來保存這個(gè)配置信息，do_fork()中的copy_sighand()負(fù)責(zé)復(fù)制該信息；輕量級(jí)進(jìn)程不進(jìn)行復(fù)制，而僅僅增加signal_struct::count計(jì)數(shù)，與父進(jìn)程共享該結(jié)構(gòu)。也就是說，子進(jìn)程與父進(jìn)程的信號(hào)處理方式完全相同，而且可以相互更改。

do_fork()中所做的工作很多，在此不詳細(xì)描述。對(duì)于SMP系統(tǒng)，所有的進(jìn)程fork出來后，都被分配到與父進(jìn)程相同的cpu上，一直到該進(jìn)程被調(diào)度時(shí)才會(huì)進(jìn)行cpu選擇。

盡管Linux支持輕量級(jí)進(jìn)程，但并不能說它就支持核心級(jí)線程，因?yàn)長(zhǎng)inux的"線程"和"進(jìn)程"實(shí)際上處于一個(gè)調(diào)度層次，共享一個(gè)進(jìn)程標(biāo)識(shí)符空間，這種限制使得不可能在Linux上實(shí)現(xiàn)完全意義上的POSIX線程機(jī)制，因此眾多的Linux線程庫(kù)實(shí)現(xiàn)嘗試都只能盡可能實(shí)現(xiàn)POSIX的絕大部分語義，并在功能上盡可能逼近。

三.LinuxThread的線程機(jī)制

LinuxThreads是目前Linux平臺(tái)上使用最為廣泛的線程庫(kù)，由Xavier Leroy (Xavier.Leroy@inria.fr)負(fù)責(zé)開發(fā)完成，并已綁定在GLIBC中發(fā)行。它所實(shí)現(xiàn)的就是基于核心輕量級(jí)進(jìn)程的"一對(duì)一"線程模型，一個(gè)線程實(shí)體對(duì)應(yīng)一個(gè)核心輕量級(jí)進(jìn)程，而線程之間的管理在核外函數(shù)庫(kù)中實(shí)現(xiàn)。

1.線程描述數(shù)據(jù)結(jié)構(gòu)及實(shí)現(xiàn)限制

LinuxThreads定義了一個(gè)struct _pthread_descr_struct數(shù)據(jù)結(jié)構(gòu)來描述線程，并使用全局?jǐn)?shù)組變量__pthread_handles來描述和引用進(jìn)程所轄線程。在__pthread_handles中的前兩項(xiàng)，LinuxThreads定義了兩個(gè)全局的系統(tǒng)線程：__pthread_initial_thread和__pthread_manager_thread，并用__pthread_main_thread表征__pthread_manager_thread的父線程（初始為__pthread_initial_thread）。

struct _pthread_descr_struct是一個(gè)雙環(huán)鏈表結(jié)構(gòu)，__pthread_manager_thread所在的鏈表僅包括它一個(gè)元素，實(shí)際上，__pthread_manager_thread是一個(gè)特殊線程，LinuxThreads僅使用了其中的errno、p_pid、p_priority等三個(gè)域。而__pthread_main_thread所在的鏈則將進(jìn)程中所有用戶線程串在了一起。經(jīng)過一系列pthread_create()之后形成的__pthread_handles數(shù)組將如下圖所示：

新創(chuàng)建的線程將首先在__pthread_handles數(shù)組中占據(jù)一項(xiàng)，然后通過數(shù)據(jù)結(jié)構(gòu)中的鏈指針連入以__pthread_main_thread為首指針的鏈表中。這個(gè)鏈表的使用在介紹線程的創(chuàng)建和釋放的時(shí)候?qū)⑻岬健?/p>

LinuxThreads遵循POSIX1003.1c標(biāo)準(zhǔn)，其中對(duì)線程庫(kù)的實(shí)現(xiàn)進(jìn)行了一些范圍限制，比如進(jìn)程最大線程數(shù)，線程私有數(shù)據(jù)區(qū)大小等等。在LinuxThreads的實(shí)現(xiàn)中，基本遵循這些限制，但也進(jìn)行了一定的改動(dòng)，改動(dòng)的趨勢(shì)是放松或者說擴(kuò)大這些限制，使編程更加方便。這些限定宏主要集中在sysdeps/unix/sysv/linux/bits/local_lim.h（不同平臺(tái)使用的文件位置不同）中，包括如下幾個(gè)：

每進(jìn)程的私有數(shù)據(jù)key數(shù)，POSIX定義_POSIX_THREAD_KEYS_MAX為128，LinuxThreads使用PTHREAD_KEYS_MAX，1024；私有數(shù)據(jù)釋放時(shí)允許執(zhí)行的操作數(shù)，LinuxThreads與POSIX一致，定義PTHREAD_DESTRUCTOR_ITERATIONS為4；每進(jìn)程的線程數(shù)，POSIX定義為64，LinuxThreads增大到1024（PTHREAD_THREADS_MAX）；線程運(yùn)行棧最小空間大小，POSIX未指定，LinuxThreads使用PTHREAD_STACK_MIN，16384（字節(jié)）。

2.管理線程

"一對(duì)一"模型的好處之一是線程的調(diào)度由核心完成了，而其他諸如線程取消、線程間的同步等工作，都是在核外線程庫(kù)中完成的。在LinuxThreads中，專門為每一個(gè)進(jìn)程構(gòu)造了一個(gè)管理線程，負(fù)責(zé)處理線程相關(guān)的管理工作。當(dāng)進(jìn)程第一次調(diào)用pthread_create()創(chuàng)建一個(gè)線程的時(shí)候就會(huì)創(chuàng)建（__clone()）并啟動(dòng)管理線程。

在一個(gè)進(jìn)程空間內(nèi)，管理線程與其他線程之間通過一對(duì)"管理管道（manager_pipe[2]）"來通訊，該管道在創(chuàng)建管理線程之前創(chuàng)建，在成功啟動(dòng)了管理線程之后，管理管道的讀端和寫端分別賦給兩個(gè)全局變量__pthread_manager_reader和__pthread_manager_request，之后，每個(gè)用戶線程都通過__pthread_manager_request向管理線程發(fā)請(qǐng)求，但管理線程本身并沒有直接使用__pthread_manager_reader，管道的讀端（manager_pipe[0]）是作為__clone()的參數(shù)之一傳給管理線程的，管理線程的工作主要就是監(jiān)聽管道讀端，并對(duì)從中取出的請(qǐng)求作出反應(yīng)。

創(chuàng)建管理線程的流程如下所示：
（全局變量pthread_manager_request初值為-1）

初始化結(jié)束后，在__pthread_manager_thread中記錄了輕量級(jí)進(jìn)程號(hào)以及核外分配和管理的線程id，2*PTHREAD_THREADS_MAX+1這個(gè)數(shù)值不會(huì)與任何常規(guī)用戶線程id沖突。管理線程作為pthread_create()的調(diào)用者線程的子線程運(yùn)行，而pthread_create()所創(chuàng)建的那個(gè)用戶線程則是由管理線程來調(diào)用clone()創(chuàng)建，因此實(shí)際上是管理線程的子線程。（此處子線程的概念應(yīng)該當(dāng)作子進(jìn)程來理解。）

__pthread_manager()就是管理線程的主循環(huán)所在，在進(jìn)行一系列初始化工作后，進(jìn)入while(1)循環(huán)。在循環(huán)中，線程以2秒為timeout查詢（__poll()）管理管道的讀端。在處理請(qǐng)求前，檢查其父線程（也就是創(chuàng)建manager的主線程）是否已退出，如果已退出就退出整個(gè)進(jìn)程。如果有退出的子線程需要清理，則調(diào)用pthread_reap_children()清理。

然后才是讀取管道中的請(qǐng)求，根據(jù)請(qǐng)求類型執(zhí)行相應(yīng)操作（switch-case）。具體的請(qǐng)求處理，源碼中比較清楚，這里就不贅述了。

3.線程棧

在LinuxThreads中，管理線程的棧和用戶線程的棧是分離的，管理線程在進(jìn)程堆中通過malloc()分配一個(gè)THREAD_MANAGER_STACK_SIZE字節(jié)的區(qū)域作為自己的運(yùn)行棧。

用戶線程的棧分配辦法隨著體系結(jié)構(gòu)的不同而不同，主要根據(jù)兩個(gè)宏定義來區(qū)分，一個(gè)是NEED_SEPARATE_REGISTER_STACK，這個(gè)屬性僅在IA64平臺(tái)上使用；另一個(gè)是FLOATING_STACK宏，在i386等少數(shù)平臺(tái)上使用，此時(shí)用戶線程棧由系統(tǒng)決定具體位置并提供保護(hù)。與此同時(shí)，用戶還可以通過線程屬性結(jié)構(gòu)來指定使用用戶自定義的棧。因篇幅所限，這里只能分析i386平臺(tái)所使用的兩種棧組織方式：FLOATING_STACK方式和用戶自定義方式。

在FLOATING_STACK方式下，LinuxThreads利用mmap()從內(nèi)核空間中分配8MB空間（i386系統(tǒng)缺省的最大棧空間大小，如果有運(yùn)行限制（rlimit），則按照運(yùn)行限制設(shè)置），使用mprotect()設(shè)置其中第一頁(yè)為非訪問區(qū)。該8M空間的功能分配如下圖：

低地址被保護(hù)的頁(yè)面用來監(jiān)測(cè)棧溢出。

對(duì)于用戶指定的棧，在按照指針對(duì)界后，設(shè)置線程棧頂，并計(jì)算出棧底，不做保護(hù)，正確性由用戶自己保證。

不論哪種組織方式，線程描述結(jié)構(gòu)總是位于棧頂緊鄰堆棧的位置。

4.線程id和進(jìn)程id

每個(gè)LinuxThreads線程都同時(shí)具有線程id和進(jìn)程id，其中進(jìn)程id就是內(nèi)核所維護(hù)的進(jìn)程號(hào)，而線程id則由LinuxThreads分配和維護(hù)。

__pthread_initial_thread的線程id為PTHREAD_THREADS_MAX，__pthread_manager_thread的是2*PTHREAD_THREADS_MAX+1，第一個(gè)用戶線程的線程id為PTHREAD_THREADS_MAX+2，此后第n個(gè)用戶線程的線程id遵循以下公式：

tid=n*PTHREAD_THREADS_MAX+n+1

這種分配方式保證了進(jìn)程中所有的線程（包括已經(jīng)退出）都不會(huì)有相同的線程id，而線程id的類型pthread_t定義為無符號(hào)長(zhǎng)整型（unsigned long int），也保證了有理由的運(yùn)行時(shí)間內(nèi)線程id不會(huì)重復(fù)。

從線程id查找線程數(shù)據(jù)結(jié)構(gòu)是在pthread_handle()函數(shù)中完成的，實(shí)際上只是將線程號(hào)按PTHREAD_THREADS_MAX取模，得到的就是該線程在__pthread_handles中的索引。

5.線程的創(chuàng)建

在pthread_create()向管理線程發(fā)送REQ_CREATE請(qǐng)求之后，管理線程即調(diào)用pthread_handle_create()創(chuàng)建新線程。分配棧、設(shè)置thread屬性后，以pthread_start_thread()為函數(shù)入口調(diào)用__clone()創(chuàng)建并啟動(dòng)新線程。pthread_start_thread()讀取自身的進(jìn)程id號(hào)存入線程描述結(jié)構(gòu)中，并根據(jù)其中記錄的調(diào)度方法配置調(diào)度。一切準(zhǔn)備就緒后，再調(diào)用真正的線程執(zhí)行函數(shù)，并在此函數(shù)返回后調(diào)用pthread_exit()清理現(xiàn)場(chǎng)。

6.LinuxThreads的不足

由于Linux內(nèi)核的限制以及實(shí)現(xiàn)難度等等原因，LinuxThreads并不是完全POSIX兼容的，在它的發(fā)行README中有說明。

1)進(jìn)程id問題

這個(gè)不足是最關(guān)鍵的不足，引起的原因牽涉到LinuxThreads的"一對(duì)一"模型。

Linux內(nèi)核并不支持真正意義上的線程，LinuxThreads是用與普通進(jìn)程具有同樣內(nèi)核調(diào)度視圖的輕量級(jí)進(jìn)程來實(shí)現(xiàn)線程支持的。這些輕量級(jí)進(jìn)程擁有獨(dú)立的進(jìn)程id，在進(jìn)程調(diào)度、信號(hào)處理、IO等方面享有與普通進(jìn)程一樣的能力。在源碼閱讀者看來，就是Linux內(nèi)核的clone()沒有實(shí)現(xiàn)對(duì)CLONE_PID參數(shù)的支持。

在內(nèi)核do_fork()中對(duì)CLONE_PID的處理是這樣的：

? if (clone_flags & CLONE_PID) { ????????if (current->pid) ????????????????goto fork_out; }

這段代碼表明，目前的Linux內(nèi)核僅在pid為0的時(shí)候認(rèn)可CLONE_PID參數(shù)，實(shí)際上，僅在SMP初始化，手工創(chuàng)建進(jìn)程的時(shí)候才會(huì)使用CLONE_PID參數(shù)。

按照POSIX定義，同一進(jìn)程的所有線程應(yīng)該共享一個(gè)進(jìn)程id和父進(jìn)程id，這在目前的"一對(duì)一"模型下是無法實(shí)現(xiàn)的。

2)信號(hào)處理問題

由于異步信號(hào)是內(nèi)核以進(jìn)程為單位分發(fā)的，而LinuxThreads的每個(gè)線程對(duì)內(nèi)核來說都是一個(gè)進(jìn)程，且沒有實(shí)現(xiàn)"線程組"，因此，某些語義不符合POSIX標(biāo)準(zhǔn)，比如沒有實(shí)現(xiàn)向進(jìn)程中所有線程發(fā)送信號(hào)，README對(duì)此作了說明。

如果核心不提供實(shí)時(shí)信號(hào)，LinuxThreads將使用SIGUSR1和SIGUSR2作為內(nèi)部使用的restart和cancel信號(hào)，這樣應(yīng)用程序就不能使用這兩個(gè)原本為用戶保留的信號(hào)了。在Linux kernel 2.1.60以后的版本都支持?jǐn)U展的實(shí)時(shí)信號(hào)（從_SIGRTMIN到_SIGRTMAX），因此不存在這個(gè)問題。

某些信號(hào)的缺省動(dòng)作難以在現(xiàn)行體系上實(shí)現(xiàn)，比如SIGSTOP和SIGCONT，LinuxThreads只能將一個(gè)線程掛起，而無法掛起整個(gè)進(jìn)程。

3)線程總數(shù)問題

LinuxThreads將每個(gè)進(jìn)程的線程最大數(shù)目定義為1024，但實(shí)際上這個(gè)數(shù)值還受到整個(gè)系統(tǒng)的總進(jìn)程數(shù)限制，這又是由于線程其實(shí)是核心進(jìn)程。

在kernel 2.4.x中，采用一套全新的總進(jìn)程數(shù)計(jì)算方法，使得總進(jìn)程數(shù)基本上僅受限于物理內(nèi)存的大小，計(jì)算公式在kernel/fork.c的fork_init()函數(shù)中：

max_threads = mempages / (THREAD_SIZE/PAGE_SIZE) / 8

在i386上，THREAD_SIZE=2*PAGE_SIZE，PAGE_SIZE=2^12（4KB），mempages=物理內(nèi)存大小/PAGE_SIZE，對(duì)于256M的內(nèi)存的機(jī)器，mempages=256*2^20/2^12=256*2^8，此時(shí)最大線程數(shù)為4096。

但為了保證每個(gè)用戶（除了root）的進(jìn)程總數(shù)不至于占用一半以上物理內(nèi)存，fork_init()中繼續(xù)指定：

init_task.rlim[RLIMIT_NPROC].rlim_cur = max_threads/2; init_task.rlim[RLIMIT_NPROC].rlim_max = max_threads/2;

這些進(jìn)程數(shù)目的檢查都在do_fork()中進(jìn)行，因此，對(duì)于LinuxThreads來說，線程總數(shù)同時(shí)受這三個(gè)因素的限制。

4)管理線程問題

管理線程容易成為瓶頸，這是這種結(jié)構(gòu)的通病；同時(shí)，管理線程又負(fù)責(zé)用戶線程的清理工作，因此，盡管管理線程已經(jīng)屏蔽了大部分的信號(hào)，但一旦管理線程死亡，用戶線程就不得不手工清理了，而且用戶線程并不知道管理線程的狀態(tài)，之后的線程創(chuàng)建等請(qǐng)求將無人處理。

5)同步問題

LinuxThreads中的線程同步很大程度上是建立在信號(hào)基礎(chǔ)上的，這種通過內(nèi)核復(fù)雜的信號(hào)處理機(jī)制的同步方式，效率一直是個(gè)問題。

6）其他POSIX兼容性問題

Linux中很多系統(tǒng)調(diào)用，按照語義都是與進(jìn)程相關(guān)的，比如nice、setuid、setrlimit等，在目前的LinuxThreads中，這些調(diào)用都僅僅影響調(diào)用者線程。

7）實(shí)時(shí)性問題

線程的引入有一定的實(shí)時(shí)性考慮，但LinuxThreads暫時(shí)不支持，比如調(diào)度選項(xiàng)，目前還沒有實(shí)現(xiàn)。不僅LinuxThreads如此，標(biāo)準(zhǔn)的Linux在實(shí)時(shí)性上考慮都很少。

四.其他的線程實(shí)現(xiàn)機(jī)制

LinuxThreads的問題，特別是兼容性上的問題，嚴(yán)重阻礙了Linux上的跨平臺(tái)應(yīng)用（如Apache）采用多線程設(shè)計(jì)，從而使得Linux上的線程應(yīng)用一直保持在比較低的水平。在Linux社區(qū)中，已經(jīng)有很多人在為改進(jìn)線程性能而努力，其中既包括用戶級(jí)線程庫(kù)，也包括核心級(jí)和用戶級(jí)配合改進(jìn)的線程庫(kù)。目前最為人看好的有兩個(gè)項(xiàng)目，一個(gè)是RedHat公司牽頭研發(fā)的NPTL（Native Posix Thread Library），另一個(gè)則是IBM投資開發(fā)的NGPT（Next Generation Posix Threading），二者都是圍繞完全兼容POSIX 1003.1c，同時(shí)在核內(nèi)和核外做工作以而實(shí)現(xiàn)多對(duì)多線程模型。這兩種模型都在一定程度上彌補(bǔ)了LinuxThreads的缺點(diǎn)，且都是重起爐灶全新設(shè)計(jì)的。

1.NPTL

NPTL的設(shè)計(jì)目標(biāo)歸納可歸納為以下幾點(diǎn)：

POSIX兼容性
SMP結(jié)構(gòu)的利用
低啟動(dòng)開銷
低鏈接開銷（即不使用線程的程序不應(yīng)當(dāng)受線程庫(kù)的影響）
與LinuxThreads應(yīng)用的二進(jìn)制兼容性
軟硬件的可擴(kuò)展能力
多體系結(jié)構(gòu)支持
NUMA支持
與C++集成

在技術(shù)實(shí)現(xiàn)上，NPTL仍然采用1:1的線程模型，并配合glibc和最新的Linux Kernel2.5.x開發(fā)版在信號(hào)處理、線程同步、存儲(chǔ)管理等多方面進(jìn)行了優(yōu)化。和LinuxThreads不同，NPTL沒有使用管理線程，核心線程的管理直接放在核內(nèi)進(jìn)行，這也帶了性能的優(yōu)化。

主要是因?yàn)楹诵牡膯栴}，NPTL仍然不是100%POSIX兼容的，但就性能而言相對(duì)LinuxThreads已經(jīng)有很大程度上的改進(jìn)了。

2.NGPT

IBM的開放源碼項(xiàng)目NGPT在2003年1月10日推出了穩(wěn)定的2.2.0版，但相關(guān)的文檔工作還差很多。就目前所知，NGPT是基于GNU Pth（GNU Portable Threads）項(xiàng)目而實(shí)現(xiàn)的M:N模型，而GNU Pth是一個(gè)經(jīng)典的用戶級(jí)線程庫(kù)實(shí)現(xiàn)。

3.其他高效線程機(jī)制

此處不能不提到Scheduler Activations。這個(gè)1991年在ACM上發(fā)表的多線程內(nèi)核結(jié)構(gòu)影響了很多多線程內(nèi)核的設(shè)計(jì)，其中包括Mach3.0、NetBSD和商業(yè)版本Digital Unix（現(xiàn)在叫Compaq True64 Unix）。它的實(shí)質(zhì)是在使用用戶級(jí)線程調(diào)度的同時(shí)，盡可能地減少用戶級(jí)對(duì)核心的系統(tǒng)調(diào)用請(qǐng)求，而后者往往是運(yùn)行開銷的重要來源。采用這種結(jié)構(gòu)的線程機(jī)制，實(shí)際上是結(jié)合了用戶級(jí)線程的靈活高效和核心級(jí)線程的實(shí)用性，因此，包括Linux、FreeBSD在內(nèi)的多個(gè)開放源碼操作系統(tǒng)設(shè)計(jì)社區(qū)都在進(jìn)行相關(guān)研究，力圖在本系統(tǒng)中實(shí)現(xiàn)Scheduler Activations。

總結(jié)

以上是生活随笔為你收集整理的线程模型、pthread 系列函数和简单多线程服务器端程序的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：原生Java代码拷贝目录
下一篇： linux下mysql无法看到3306端

编程问答

线程模型、pthread 系列函数 和 简单多线程服务器端程序

Linux 的多線程編程的高效開發(fā)經(jīng)驗(yàn)

背景

Linux 上線程開發(fā) API 的概要介紹

表 1. 線程函數(shù)列表

Linux 線程編程中的 5 條經(jīng)驗(yàn)

盡量設(shè)置 recursive 屬性以初始化 Linux 的互斥變量

清單 1. Linux 重復(fù)對(duì)互斥鎖加鎖實(shí)例

清單 2. 設(shè)置互斥鎖 recursive 屬性實(shí)例

注意 Linux 平臺(tái)上觸發(fā)條件變量的自動(dòng)復(fù)位問題

圖 1. Windows 的條件變量狀態(tài)變化流程

圖 2. Linux 的條件變量狀態(tài)變化流程

圖 3. 采用 Windows 條件變量模型的出租車實(shí)例流程

清單 3. Linux 出租車案例代碼實(shí)例

清單 4. 程序結(jié)果輸出

圖 4. 采用 Linux 條件變量模型的出租車實(shí)例流程

清單 5. Linux 出租車案例代碼實(shí)例

注意條件返回時(shí)互斥鎖的解鎖問題

清單 6. 條件變量返回后的解鎖實(shí)例

等待的絕對(duì)時(shí)間問題

清單 7. pthread_cond_timedwait() 函數(shù)定義

清單 8. 相對(duì)時(shí)間到絕對(duì)時(shí)間轉(zhuǎn)換實(shí)例

正確處理 Linux 平臺(tái)下的線程結(jié)束問題

清單 9. pthread_join 函數(shù)定義

清單 10. pthread_detach 函數(shù)定義

清單 11. 創(chuàng)建 detach 線程代碼實(shí)例

總結(jié)與補(bǔ)充

相關(guān)主題

Linux 線程實(shí)現(xiàn)機(jī)制分析

一.基礎(chǔ)知識(shí)：線程和進(jìn)程

二.Linux 2.4內(nèi)核中的輕量進(jìn)程實(shí)現(xiàn)

三.LinuxThread的線程機(jī)制

1.線程描述數(shù)據(jù)結(jié)構(gòu)及實(shí)現(xiàn)限制

2.管理線程

3.線程棧

4.線程id和進(jìn)程id

5.線程的創(chuàng)建

6.LinuxThreads的不足

四.其他的線程實(shí)現(xiàn)機(jī)制

相關(guān)主題

總結(jié)

线程模型、pthread 系列函数和简单多线程服务器端程序