POSIX线程：API

2023-11-17

（一）线程创建与取消

1. 线程创建

1.1 线程与进程

相对进程而言，线程是一个更加接近于执行体的概念，它可以与同进程中的其他线程共享数据，但拥有自己的栈空间，拥有独立的执行序列。在串行程序基础上引入线程和进程是为了提高程序的并发度，从而提高程序运行效率和响应时间。

线程和进程在使用上各有优缺点：线程执行开销小，但不利于资源的管理和保护；而进程正相反。同时，线程适合于在SMP机器上运行，而进程则可以跨机器迁移。

1.2 创建线程

POSIX通过pthread_create()函数创建线程，API定义如下：

int pthread_create(pthread_t *thread, pthread_attr_t *attr, void * (*start_routine)(void *), void * arg);

与fork()调用创建一个进程的方法不同，pthread_create()创建的线程并不具备与主线程（即调用pthread_create()的线程）同样的执行序列，而是使其运行start_routine(arg)函数。thread返回创建的线程ID，而attr是创建线程时设置的线程属性（见下）。pthread_create()的返回值表示线程创建是否成功。尽管arg是void *类型的变量，但它同样可以作为任意类型的参数传给start_routine()函数；同时，start_routine()可以返回一个void *类型的返回值，而这个返回值也可以是其他类型，并由pthread_join()获取。

1.3 线程创建属性

pthread_create()中的attr参数是一个结构指针，结构中的元素分别对应着新线程的运行属性，主要包括以下几项：

__detachstate：表示新线程是否与进程中其他线程脱离同步，如果置位则新线程不能用pthread_join()来同步，且在退出时自行释放所占用的资源。缺省为PTHREAD_CREATE_JOINABLE状态。这个属性也可以在线程创建并运行以后用pthread_detach()来设置，而一旦设置为PTHREAD_CREATE_DETACH状态（不论是创建时设置还是运行时设置）则不能再恢复到 PTHREAD_CREATE_JOINABLE状态。
__schedpolicy：表示新线程的调度策略，主要包括SCHED_OTHER（正常、非实时）、SCHED_RR（实时、轮转法）和 SCHED_FIFO（实时、先入先出）三种，缺省为SCHED_OTHER，后两种调度策略仅对超级用户有效。运行时可以用过 pthread_setschedparam()来改变。
__schedparam：一个struct sched_param结构，目前仅有一个sched_priority整型变量表示线程的运行优先级。这个参数仅当调度策略为实时（即SCHED_RR 或SCHED_FIFO）时才有效，并可以在运行时通过pthread_setschedparam()函数来改变，缺省为0。
__inheritsched：有两种值可供选择：PTHREAD_EXPLICIT_SCHED和PTHREAD_INHERIT_SCHED，前者表示新线程使用显式指定调度策略和调度参数（即attr中的值），而后者表示继承调用者线程的值。缺省为PTHREAD_EXPLICIT_SCHED。
__scope：表示线程间竞争CPU的范围，也就是说线程优先级的有效范围。POSIX的标准中定义了两个值：PTHREAD_SCOPE_SYSTEM 和 PTHREAD_SCOPE_PROCESS，前者表示与系统中所有线程一起竞争CPU时间，后者表示仅与同进程中的其他线程竞争CPU时间。目前LinuxThreads仅实现了PTHREAD_SCOPE_SYSTEM一值。

pthread_attr_t结构中还有一些值，但不使用pthread_create()来设置。

为了设置这些属性，POSIX定义了一系列属性设置函数，包括pthread_attr_init()、pthread_attr_destroy()和与各个属性相关的pthread_attr_getXXX/pthread_attr_setXXX函数。

1.4 线程创建的Linux实现

Linux的线程实现是在核外进行的，核内提供的是创建进程的接口do_fork()。内核提供了两个系统调用__clone()和 fork()，最终都用不同的参数调用do_fork()核内API。当然，要想实现线程，没有核心对多进程（其实是轻量级进程）共享数据段的支持是不行的。因此，do_fork()提供了很多参数，包括CLONE_VM（共享内存空间）、CLONE_FS（共享文件系统信息）、 CLONE_FILES（共享文件描述符表）、CLONE_SIGHAND（共享信号句柄表）和CLONE_PID（共享进程ID，仅对核内进程，即0号进程有效）。当使用fork系统调用时，内核调用do_fork()不使用任何共享属性，进程拥有独立的运行环境，而使用 pthread_create() 来创建线程时,则最终设置了所有这些属性来调用__clone()，而这些参数又全部传给核内的do_fork()，从而创建的"进程"拥有共享的运行环境，只有栈是独立的，由__clone()传入。

Linux线程在核内是以轻量级进程的形式存在的，拥有独立的进程表项，而所有的创建、同步、删除等操作都在核外pthread库中进行。pthread 库使用一个管理线程（__pthread_manager()，每个进程独立且唯一）来管理线程的创建和终止，为线程分配线程ID，发送线程相关的信号（比如Cancel），而主线程（pthread_create()的调用者）则通过管道将请求信息传给管理线程。

2. 线程取消

2.1 线程取消的定义

一般情况下，线程在其主体函数退出的时候会自动终止，但同时也可以因为接收到另一个线程发来的终止（取消）请求而强制终止。

2.2 线程取消的语义

线程取消的方法是向目标线程发CANCEL信号，但如何处理Cancel信号则由目标线程自己决定：或者忽略、或者立即终止、或者继续运行至Cancelation-point（取消点），由不同的Cancelation状态决定。

线程接收到CANCEL信号的缺省处理（即pthread_create()创建线程的缺省状态）是继续运行至取消点，也就是说设置一个CANCELED状态，线程继续运行，只有运行至Cancelation-point的时候才会退出。

2.3 取消点

根据POSIX标准，pthread_join()、pthread_testcancel()、pthread_cond_wait()、 pthread_cond_timedwait()、sem_wait()、sigwait()等函数以及read()、write()等会引起阻塞的系统调用都是Cancelation-point，而其他pthread函数都不会引起Cancelation动作。但是pthread_cancel的手册页声称，由于LinuxThread库与C库结合得不好，因而目前C库函数都不是Cancelation-point；但CANCEL信号会使线程从阻塞的系统调用中退出，并置EINTR错误码，因此可以在需要作为Cancelation-point的系统调用前后调用 pthread_testcancel()，从而达到POSIX标准所要求的目标，即如下代码段：

pthread_testcancel(); retcode = read(fd, buffer, length); pthread_testcancel();

2.4 程序设计方面的考虑

如果线程处于无限循环中，且循环体内没有执行至取消点的必然路径，则线程无法由外部其他线程的取消请求而终止。因此在这样的循环体的必经路径上应该加入pthread_testcancel()调用。

2.5 与线程取消相关的pthread函数

int pthread_cancel(pthread_t thread);
发送终止信号给thread线程，如果成功则返回0，否则为非0值。发送成功并不意味着thread会终止。

int pthread_setcancelstate(int state, int *oldstate);
设置本线程对CANCEL信号的反应，state有两种值：PTHREAD_CANCEL_ENABLE（缺省）和 PTHREAD_CANCEL_DISABLE，分别表示收到信号后设为CANCELED状态和忽略CANCEL信号继续运行；old_state如果不为 NULL则存入原来的Cancel状态以便恢复。

int pthread_setcanceltype(int type, int *oldtype);
设置本线程取消动作的执行时机，type由两种取值：PTHREAD_CANCEL_DEFFERED和 PTHREAD_CANCEL_ASYCHRONOUS，仅当Cancel状态为Enable时有效，分别表示收到信号后继续运行至下一个取消点再退出和立即执行取消动作（退出）；oldtype如果不为NULL则存入原来的取消动作类型值。

void pthread_testcancel(void);
检查本线程是否处于Canceled状态；如果是，则进行取消动作，否则直接返回。

（二）线程私有数据

1. 概念与作用

在单线程程序中，我们经常要用到"全局变量"以实现多个函数间共享数据。在多线程环境下，由于数据空间是共享的，因此全局变量也为所有线程所共享。但有时应用程序设计中有必要提供线程私有的全局变量，仅在某个线程中有效，但却可以跨多个函数访问，比如程序可能需要每个线程维护一个链表，而使用相同的函数操作，最简单的办法就是使用同名而不同变量地址的线程相关数据结构。这样的数据结构可以由posix线程库维护，称为线程私有数据（Thread- specific Data，或TSD）。

2. 创建与注销

posix定义了两个API分别用来创建和注销TSD：

int pthread_key_create(pthread_key_t *key, void (*destr_function) (void *));

该函数从TSD池中分配一项，将其值赋给key供以后访问使用。如果destr_function不为空，在线程退出（pthread_exit()）时将以key所关联的数据为参数调用destr_function()，以释放分配的缓冲区。

不论哪个线程调用pthread_key_create()，所创建的key都是所有线程可访问的，但各个线程可根据自己的需要往key中填入不同的值，这就相当于提供了一个同名而不同值的全局变量。在LinuxThreads的实现中，TSD池用一个结构数组表示：

static struct pthread_key_struct pthread_keys[PTHREAD_KEYS_MAX] = { { 0, NULL } };

创建一个TSD就相当于将结构数组中的某一项设置为"in_use"，并将其索引返回给*key，然后设置destructor函数为destr_function。

注销一个TSD采用如下API：

int pthread_key_delete(pthread_key_t key);

这个函数并不检查当前是否有线程正使用该TSD，也不会调用清理函数（destr_function），而只是将TSD释放以供下一次调用 pthread_key_create()使用。在LinuxThreads中，它还会将与之相关的线程数据项设为NULL（见"访问"）。

3. 访问

TSD的读写都通过专门的posix Thread函数进行，其API定义如下：

int  pthread_setspecific(pthread_key_t  key,  const   void  *pointer);
void * pthread_getspecific(pthread_key_t key);

写入（pthread_setspecific()）时，将pointer的值（不是所指的内容）与key相关联，而相应的读出函数则将与key相关联的数据读出来。数据类型都设为void *，因此可以指向任何类型的数据。

在LinuxThreads中，使用了一个位于线程描述结构（_pthread_descr_struct）中的二维void *指针数组来存放与key关联的数据，数组大小由以下几个宏来说明：

#define PTHREAD_KEY_2NDLEVEL_SIZE 32 #define PTHREAD_KEY_1STLEVEL_SIZE / ((PTHREAD_KEYS_MAX + PTHREAD_KEY_2NDLEVEL_SIZE - 1) / PTHREAD_KEY_2NDLEVEL_SIZE) /* 其中在/usr/include/bits/local_lim.h中定义了PTHREAD_KEYS_MAX为1024，因此一维数组大小为32。而具体存放的位置由key值经过以下计算得到： idx1st = key / PTHREAD_KEY_2NDLEVEL_SIZE; idx2nd = key % PTHREAD_KEY_2NDLEVEL_SIZE; */

也就是说，数据存放与一个32×32的稀疏矩阵中。同样，访问的时候也由key值经过类似计算得到数据所在位置索引，再取出其中内容返回。

4. 使用范例

以下这个例子没有什么实际意义，只是说明如何使用，以及能够使用这一机制达到存储线程私有数据的目的。

#include <stdio.h> #include <pthread.h> pthread_key_t key; void echo_msg(unsigned long t) { printf("destructor executed in thread %lu, param=%lu/n", pthread_self(), t); } void *thread1(void *arg) { pthread_t tid = pthread_self(); printf("thread %lu enter/n", tid); pthread_setspecific(key, (void *)tid); sleep(2); printf("thread %lu returns %lu/n", tid, (unsigned long)pthread_getspecific(key)); sleep(5); return NULL; } void *thread2(void *arg) { pthread_t tid = pthread_self(); printf("thread %lu enter/n", tid); pthread_setspecific(key, (void *)tid); sleep(1); printf("thread %lu returns %lu/n", tid, (unsigned long)pthread_getspecific(key)); sleep(5); return NULL; } int main(void) { pthread_t tid1, tid2; printf("main thread start/n"); pthread_key_create(&key, (void (*)(void *))echo_msg); pthread_create(&tid1, NULL, thread1, NULL); pthread_create(&tid2, NULL, thread2, NULL); sleep(10); pthread_key_delete(key); printf("main thread exit/n"); return 0; }

执行结果如下：

main thread start thread 3078794096 enter thread 3070401392 enter thread 3070401392 returns 3070401392 thread 3078794096 returns 3078794096 destructor executed in thread 3070401392, param=3070401392 destructor executed in thread 3078794096, param=3078794096 main thread exit

给例程创建两个线程分别设置同一个线程私有数据为自己的线程ID，为了检验其私有性，程序错开了两个线程私有数据的写入和读出的时间，从程序运行结果可以看出，两个线程对TSD的修改互不干扰。同时，当线程退出时，清理函数会自动执行，参数为tid。

（三）线程同步

1. 互斥锁

尽管在Posix Thread中同样可以使用IPC的信号量机制来实现互斥锁mutex功能，但显然semphore的功能过于强大了，在Posix Thread中定义了另外一套专门用于线程同步的mutex函数。

1.1 创建与销毁

有两种方法创建互斥锁，静态方式和动态方式。POSIX定义了一个宏PTHREAD_MUTEX_INITIALIZER来静态初始化互斥锁，方法如下：

pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;

在LinuxThreads实现中，pthread_mutex_t是一个结构，而PTHREAD_MUTEX_INITIALIZER则是一个结构常量。

动态方式是采用pthread_mutex_init()函数来初始化互斥锁，API定义如下：

int pthread_mutex_init(pthread_mutex_t *mutex, const pthread_mutexattr_t *mutexattr);

其中mutexattr用于指定互斥锁属性（见下），如果为NULL则使用缺省属性。

pthread_mutex_destroy()用于注销一个互斥锁，API定义如下：

int pthread_mutex_destroy(pthread_mutex_t *mutex);

销毁一个互斥锁即意味着释放它所占用的资源，且要求锁当前处于开放状态。由于在Linux中，互斥锁并不占用任何资源，因此LinuxThreads中的pthread_mutex_destroy()除了检查锁状态以外（锁定状态则返回EBUSY）没有其他动作。

1.2 互斥锁属性

互斥锁的属性在创建锁的时候指定，在LinuxThreads实现中仅有一个锁类型属性，不同的锁类型在试图对一个已经被锁定的互斥锁加锁时表现不同。当前（glibc-2.2.3, linux-threads-0.9）有四个值可供选择：

PTHREAD_MUTEX_TIMED_NP：缺省值，也就是普通锁。当一个线程加锁以后，其余请求锁的线程将形成一个等待队列，并在解锁后按优先级获得锁。这种锁策略保证了资源分配的公平性。
PTHREAD_MUTEX_RECURSIVE_NP：嵌套锁，允许同一个线程对同一个锁成功获得多次，并通过多次unlock解锁。如果是不同线程请求，则在加锁线程解锁时重新竞争。
PTHREAD_MUTEX_ERRORCHECK_NP：检错锁，如果同一个线程请求同一个锁，则返回EDEADLK，否则与PTHREAD_MUTEX_TIMED_NP类型动作相同。这样就保证当不允许多次加锁时不会出现最简单情况下的死锁。
PTHREAD_MUTEX_ADAPTIVE_NP：适应锁，动作最简单的锁类型，仅等待解锁后重新竞争。

1.3 锁操作

锁操作主要包括加锁pthread_mutex_lock()、解锁pthread_mutex_unlock()和测试加锁 pthread_mutex_trylock()三个，不论哪种类型的锁，都不可能被两个不同的线程同时得到，而必须等待解锁。对于普通锁和适应锁类型，解锁者可以是同进程内任何线程；而检错锁则必须由加锁者解锁才有效，否则返回EPERM；对于嵌套锁，文档和实现要求必须由加锁者解锁，但实验结果表明并没有这种限制，这个不同目前还没有得到解释。在同一进程中的线程，如果加锁后没有解锁，则任何其他线程都无法再获得锁。

int pthread_mutex_lock(pthread_mutex_t *mutex); int pthread_mutex_unlock(pthread_mutex_t *mutex); int pthread_mutex_trylock(pthread_mutex_t *mutex);

pthread_mutex_trylock()语义与pthread_mutex_lock()类似，不同的是在锁已经被占据时返回EBUSY而不是挂起等待。

1.4 其他

POSIX 线程锁机制的Linux实现都不是取消点。因此，延迟取消类型的线程不会因收到取消信号而离开加锁等待。值得注意的是，如果线程在加锁后解锁前被取消，锁将永远保持锁定状态，因此如果在临界区段内有取消点存在，或者设置了异步取消类型，则必须在退出回调函数中解锁。这个锁机制同时也不是异步信号安全的。也就是说，不应该在信号处理过程中使用互斥锁，否则容易造成死锁。

2. 条件变量

条件变量是利用线程间共享的全局变量进行同步的一种机制。主要包括两个动作：一个线程等待"条件变量的条件成立"而挂起；另一个线程使"条件成立"（给出条件成立信号）。为了防止竞争，条件变量的使用总是和一个互斥锁结合在一起。

2.1 创建与销毁

条件变量和互斥锁一样，都有静态/动态两种创建方式，静态方式使用PTHREAD_COND_INITIALIZER常量，如下：
pthread_cond_t cond = PTHREAD_COND_INITIALIZER;

动态方式调用pthread_cond_init()函数，API定义如下：
int pthread_cond_init(pthread_cond_t *cond, pthread_condattr_t *cond_attr);

尽管POSIX标准中为条件变量定义了属性，但在LinuxThreads中没有实现，因此cond_attr值通常为NULL，且被忽略。

注销一个条件变量需要调用pthread_cond_destroy()，只有在没有线程在该条件变量上等待的时候才能注销这个条件变量，否则返回EBUSY。因为Linux实现的条件变量没有分配什么资源，所以注销动作只包括检查是否有等待线程。API定义如下：
int pthread_cond_destroy(pthread_cond_t *cond);

2.2 等待与激发

等待条件有两种方式：无条件等待pthread_cond_wait()和计时等待pthread_cond_timedwait()，其中计时等待方式如果在给定时刻前条件没有满足，则返回ETIMEDOUT，结束等待，其中abstime以与time()系统调用相同意义的绝对时间形式出现，0表示格林尼治时间1970年1月1日0时0分0秒。

int pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex); int pthread_cond_timedwait(pthread_cond_t *cond, pthread_mutex_t *mutex, const struct timespec *abstime);

无论哪种等待方式，都必须和一个互斥锁配合，以防止多个线程同时请求pthread_cond_wait()（或 pthread_cond_timedwait()，下同）的竞争条件（Race Condition）。mutex互斥锁必须是普通锁（PTHREAD_MUTEX_TIMED_NP）或者适应锁（PTHREAD_MUTEX_ADAPTIVE_NP），且在调用pthread_cond_wait()前必须由本线程加锁（pthread_mutex_lock()），而在更新条件等待队列以前，mutex保持锁定状态，并在线程挂起进入等待前解锁。在条件满足从而离开 pthread_cond_wait()之前，mutex将被重新加锁，以与进入pthread_cond_wait()前的加锁动作对应。

激发条件有两种形式，pthread_cond_signal()激活一个等待该条件的线程，存在多个等待线程时按入队顺序激活其中一个；而pthread_cond_broadcast()则激活所有等待线程。

int pthread_cond_broadcast(pthread_cond_t *cond); int pthread_cond_signal(pthread_cond_t *cond);

2.3 其他

pthread_cond_wait() 和pthread_cond_timedwait()都被实现为取消点。因此，在该处等待的线程将立即重新运行，在重新锁定mutex后离开 pthread_cond_wait()，然后执行取消动作。也就是说如果pthread_cond_wait()被取消，mutex是保持锁定状态的，因而需要定义退出回调函数来为其解锁。

以下示例集中演示了互斥锁和条件变量的结合使用，以及取消对于条件等待动作的影响。在例子中，有两个线程被启动，并等待同一个条件变量。如果不使用退出回调函数（见范例中的注释部分），则tid2将在pthread_mutex_lock()处永久等待。如果使用回调函数，则tid2的条件等待及主线程的条件激发都能正常工作。

#include <pthread.h> #include <stdio.h> #include <unistd.h> pthread_mutex_t mutex; pthread_cond_t cond; void *thread1(void *arg) { pthread_cleanup_push((void (*)(void *))pthread_mutex_unlock, (void *)&mutex); /* comment 1 */ while(1) { printf("thread 1 get running /n"); /* 加锁 */ printf("thread 1 pthread_mutex_lock returns %d/n", pthread_mutex_lock(&mutex)); /* 条件等待 */ pthread_cond_wait(&cond, &mutex); printf("thread 1 condition applied/n"); /* 解锁 */ pthread_mutex_unlock(&mutex); sleep(5); } pthread_cleanup_pop(0); /* comment 2 */ return NULL; } void *thread2(void *arg) { while(1) { sleep(3); /* comment 3 */ printf("thread 2 get running./n"); printf("thread 2 pthread_mutex_lock returns %d/n", pthread_mutex_lock(&mutex)); pthread_cond_wait(&cond, &mutex); printf("thread 2 condition applied/n"); pthread_mutex_unlock(&mutex); sleep(1); } return NULL; } int main(void) { pthread_t tid1, tid2; printf("main thread, condition variable test/n"); pthread_mutex_init(&mutex, NULL); pthread_cond_init(&cond, NULL); pthread_create(&tid1, NULL, thread1, NULL); pthread_create(&tid2, NULL, thread2, NULL); do { sleep(2); /* comment 4 */ pthread_cancel(tid1); /* comment 5 */ sleep(2); /* comment 6 */ pthread_cond_signal(&cond); } while (1); sleep(100); pthread_exit(0); }

如果不做注释5的pthread_cancel()动作，即使没有那些sleep()延时操作，thread1和thread2都能正常工作。注释3和注释4 的延迟使得thread1有时间完成取消动作，从而使thread2能在thread1退出之后进入请求锁操作。如果没有注释1和注释2的回调函数定义，系统将挂起在thread2请求锁的地方；而如果同时也不做注释3和注释4的延时，thread2能在thread1完成取消动作以前得到控制，从而顺利执行申请锁的操作，但却可能挂起在pthread_cond_wait()中，因为其中也有申请mutex的操作。thread1函数给出的是标准的条件变量的使用方式：回调函数保护，等待条件前锁定，pthread_cond_wait()返回后解锁。

条件变量机制不是异步信号安全的。也就是说，在信号处理函数中调用pthread_cond_signal()或者pthread_cond_broadcast()很可能引起死锁。

3. 信号灯

信号灯与互斥锁和条件变量的主要不同在于"灯"的概念：灯亮则意味着资源可用，灯灭则意味着不可用。如果说后两种同步方式侧重于"等待"操作，即资源不可用的话，信号灯机制则侧重于点灯，即告知资源可用；没有等待线程的解锁或激发条件都是没有意义的，而没有等待灯亮的线程的点灯操作则有效，且能保持灯亮状态。当然，这样的操作原语也意味着更多的开销。信号灯的应用除了灯亮/灯灭这种二元灯以外，也可以采用大于1的灯数，以表示资源数大于1，这时可以称之为多元灯。

3.1 创建与销毁

POSIX信号灯标准定义了有名信号灯和无名信号灯两种，但LinuxThreads的实现仅有无名灯，同时有名灯除了总是可用于多进程之间以外，在使用上与无名灯并没有很大的区别，因此下面仅就无名灯进行讨论。

int sem_init(sem_t *sem, int pshared, unsigned int value);
这是创建信号灯的API，其中value为信号灯的初值，pshared表示是否为多进程共享而不仅仅是用于一个进程。LinuxThreads没有实现多进程共享信号灯，因此所有非0值的pshared输入都将使sem_init()返回-1，且置errno为ENOSYS。初始化好的信号灯由sem变量表征，用于以下点灯、灭灯操作。

int sem_destroy(sem_t *sem);
被注销的信号灯sem要求已没有线程在等待该信号灯，否则返回-1，且置errno为EBUSY。除此之外，LinuxThreads的信号灯注销函数不做其他动作。

3.2 点灯与灭灯

int sem_post(sem_t *sem); int sem_wait(sem_t *sem); int sem_trywait(sem_t *sem); int sem_timedwait(sem_t *sem, const struct timespec *abs_timeout);

点灯操作将信号灯值原子地加1，表示增加一个可访问的资源。

sem_wait()为等待灯亮操作，等待灯亮（信号灯值大于0），然后将信号灯原子地减1，并返回。sem_trywait()为sem_wait()的非阻塞版，如果信号灯计数大于0，则原子地减1并返回0；否则立即返回-1，errno置为EAGAIN。

3.3 获取灯值

int sem_getvalue(sem_t * sem, int *sval);

读取sem中的灯计数，存于*sval中，并返回0。

3.4 其他

sem_wait()被实现为取消点，而且在支持原子"比较且交换"指令的体系结构上，sem_post()是唯一能用于异步信号处理函数的POSIX异步信号安全的API。

4. 异步信号

由于LinuxThreads是在核外使用核内轻量级进程实现的线程，所以基于内核的异步信号操作对于线程也是有效的。但同时，由于异步信号总是实际发往某个进程，所以无法实现POSIX标准所要求的"信号到达某个进程，然后再由该进程将信号分发到所有没有阻塞该信号的线程中"原语，而是只能影响到其中一个线程。

POSIX异步信号同时也是一个标准C库提供的功能，主要包括信号集管理（sigemptyset()、sigfillset()、 sigaddset()、sigdelset()、sigismember()等）、信号处理函数安装（sigaction()）、信号阻塞控制（sigprocmask()）、被阻塞信号查询（sigpending()）、信号等待（sigsuspend()）等，它们与发送信号的kill() 等函数配合就能实现进程间异步信号功能。LinuxThreads围绕线程封装了sigaction()与raise()，本节集中讨论 LinuxThreads中扩展的异步信号函数，包括pthread_sigmask()、pthread_kill()和sigwait()三个函数。毫无疑问，所有POSIX异步信号函数对于线程都是可用的。

int pthread_sigmask(int how, const sigset_t *newmask, sigset_t *oldmask);
设置线程的信号屏蔽码，语义与sigprocmask()相同，但对不允许屏蔽的Cancel信号和不允许响应的Restart信号进行了保护。被屏蔽的信号保存在信号队列中，可由sigpending()函数取出。

int pthread_kill(pthread_t thread, int signo);
向thread线程发送signo信号。实现中在通过thread线程号定位到对应进程号以后使用kill()系统调用完成发送。

int sigwait(const sigset_t *set, int *sig);
挂起线程，等待set中指定的信号之一到达，并将到达的信号存入*sig中。POSIX标准建议在调用sigwait()等待信号以前，进程中所有线程都应屏蔽该信号，以保证仅有sigwait()的调用者获得该信号。因此，对于需要等待同步的异步信号，总是应该在创建任何线程以前调用 pthread_sigmask()屏蔽该信号的处理。而且，调用sigwait()期间，原来附接在该信号上的信号处理函数不会被调用。如果在等待期间接收到Cancel信号，则立即退出等待，也就是说sigwait()被实现为取消点。

5. 其他同步方式

除了上述讨论的同步方式以外，其他很多进程间通信手段对于LinuxThreads也是可用的。比如基于文件系统的IPC（管道、Unix域Socket等）、消息队列（SysV或者posix的）、System V的信号灯等。只有一点需要注意，LinuxThreads在核内是作为共享存储区、共享文件系统属性、共享信号处理、共享文件描述符的独立进程看待的。

（四）线程终止

1. 线程终止方式

一般来说，posix的线程终止有两种情况：正常终止和非正常终止。线程主动调用pthread_exit()或者从线程函数中return都将使线程正常退出，这是可预见的退出方式；非正常终止是线程在其他线程的干预下，或者由于自身运行出错（比如访问非法地址）而退出，这种退出方式是不可预见的。

2. 线程终止时的清理

不论是可预见的线程终止还是异常终止，都会存在资源释放的问题。在不考虑因运行出错而退出的前提下，如何保证线程终止时能顺利的释放掉自己所占用的资源，特别是锁资源，就是一个必须考虑解决的问题。

最经常出现的情形是资源独占锁的使用：线程为了访问临界资源而为其加上锁，但在访问过程中被外界取消，如果线程处于响应取消状态，且采用异步方式响应，或者在打开独占锁以前的运行路径上存在取消点，则该临界资源将永远处于锁定状态而得不到释放。外界取消操作是不可预见的，因此的确需要一个机制来简化用于资源释放的编程。

在POSIX线程API中提供了一个pthread_cleanup_push()/pthread_cleanup_pop()函数对用于自动释放资源 --从pthread_cleanup_push()的调用点到pthread_cleanup_pop()之间的程序段中的终止动作（包括调用 pthread_exit()和取消点终止）都将执行pthread_cleanup_push()所指定的清理函数。API定义如下：

void pthread_cleanup_push(void (*routine) (void  *),  void *arg);
void pthread_cleanup_pop(int execute);

pthread_cleanup_push()/pthread_cleanup_pop()采用先入后出的栈结构管理，void routine(void *arg)函数在调用pthread_cleanup_push()时压入清理函数栈，多次对pthread_cleanup_push()的调用将在清理函数栈中形成一个函数链，在执行该函数链时按照压栈的相反顺序弹出。execute参数表示执行到pthread_cleanup_pop()时是否在弹出清理函数的同时执行该函数，为0表示不执行，非0为执行；这个参数并不影响异常终止时清理函数的执行。

pthread_cleanup_push()/pthread_cleanup_pop()是以宏方式实现的，这是pthread.h中的宏定义：

可见，pthread_cleanup_push()带有一个"{"，而pthread_cleanup_pop()带有一个"}"，因此这两个函数必须成对出现，且必须位于程序的同一级别的代码段中才能通过编译。在下面的例子里，当线程在"do some work"中终止时，将主动调用pthread_mutex_unlock(mutex)，以完成解锁动作。

必须要注意的是，如果线程处于PTHREAD_CANCEL_ASYNCHRONOUS状态，上述代码段就有可能出错，因为CANCEL事件有可能在 pthread_cleanup_push()和pthread_mutex_lock()之间发生，或者在 pthread_mutex_unlock()和pthread_cleanup_pop()之间发生，从而导致清理函数unlock一个并没有加锁的 mutex变量，造成错误。因此，在使用清理函数的时候，都应该暂时设置成PTHREAD_CANCEL_DEFERRED模式。为此，POSIX的 Linux实现中还提供了一对不保证可移植的 pthread_cleanup_push_defer_np()/pthread_cleanup_pop_defer_np()扩展函数，功能与以下代码段相当：

3. 线程终止的同步及其返回值

一般情况下，进程中各个线程的运行都是相互独立的，线程的终止并不会通知，也不会影响其他线程，终止的线程所占用的资源也并不会随着线程的终止而得到释放。正如进程之间可以用wait()系统调用来同步终止并释放资源一样，线程之间也有类似机制，那就是pthread_join()函数。

pthread_join()的调用者将挂起并等待tid线程终止，retval是pthread_exit()调用者线程（线程ID为tid）的返回值。如果thread_return不为NULL，则*thread_return=retval。需要注意的是一个线程仅允许唯一的1个线程使用 pthread_join()等待它的终止，并且被等待的线程应该处于可join状态，即非DETACHED状态。

如果进程中的某个线程执行了pthread_detach(tid)，则tid线程将处于DETACHED状态，这使得tid线程在结束运行时自行释放所占用的内存资源，同时也无法由pthread_join()同步，pthread_detach()执行之后，对tid请求pthread_join()将返回错误。

一个可join的线程所占用的内存仅当有线程对其执行了pthread_join()后才会释放。因此为了避免内存泄漏，所有线程的终止，要么已设为DETACHED，要么就需要使用pthread_join()来回收。

4. 关于pthread_exit()和return

理论上说，pthread_exit()和线程宿体函数退出的功能是相同的，函数结束时会在内部自动调用pthread_exit()来清理线程相关的资源。但实际上二者由于编译器的处理有很大的不同。

首先，在进程主函数（main()）中调用pthread_exit()，只会使主函数所在的线程（进程的主线程）退出；而如果是return，编译器将使其调用进程退出的代码（如_exit()），从而导致进程及其所有线程结束运行。

其次，在线程宿主函数中主动调用return，如果return语句包含在pthread_cleanup_push()/pthread_cleanup_pop()对中，则不会引起清理函数的执行，反而会导致segment fault。

（五）杂项

在posix线程规范中还有几个辅助函数难以归类，暂且称其为杂项函数，主要包括pthread_self()、pthread_equal()和 pthread_once()三个，另外还有一个LinuxThreads非可移植性扩展函数 pthread_kill_other_threads_np()。本文就介绍这几个函数的定义和使用。

1. 获得本线程ID

pthread_t pthread_self(void);

本函数返回本线程的标识符。

在LinuxThreads中，每个线程都用一个pthread_descr结构来描述，其中包含了线程状态、线程ID等所有需要的数据结构，此函数的实现就是在线程栈帧中找到本线程的pthread_descr结构，然后返回其中的p_tid项。

pthread_t类型在LinuxThreads中定义为无符号长整型。

2. 判断两个线程是否为同一线程

int pthread_equal(pthread_t thread1, pthread_t thread2);

判断两个线程描述符是否指向同一线程。在LinuxThreads中，线程ID相同的线程必然是同一个线程。因此，这个函数的实现仅仅判断thread1和thread2是否相等。

3. 仅执行一次的操作

int pthread_once(pthread_once_t *once_control, void (*init_routine)(void));

本函数使用初值为PTHREAD_ONCE_INIT的once_control变量保证init_routine()函数在本进程执行序列中仅执行一次。

输出如下：

main thread thread 3079113584 enter thread 3070720880 enter once_run in thread 3079113584 thread 3079113584 return thread 3070720880 return main thread exit

once_run()函数仅执行一次，且究竟在哪个线程中执行是不定的，尽管pthread_once(&once,once_run)出现在两个线程中。

LinuxThreads使用互斥锁和条件变量保证由pthread_once()指定的函数执行且仅执行一次，而once_control则表征是否执行过。如果once_control的初值不是PTHREAD_ONCE_INIT（LinuxThreads定义为0），pthread_once() 的行为就会不正常。在LinuxThreads中，实际"一次性函数"的执行状态有三种：NEVER（0）、IN_PROGRESS（1）、 DONE（2），如果once初值设为1，则由于所有pthread_once()都必须等待其中一个激发"已执行一次"信号，因此所有 pthread_once()都会陷入永久的等待中；如果设为2，则表示该函数已执行过一次，从而所有pthread_once()都会立即返回0。

4. pthread_kill_other_threads_np

void pthread_kill_other_threads_np(void);

这个函数是LinuxThreads针对本身无法实现的POSIX约定而做的扩展。POSIX要求当进程的某一个线程执行exec*系统调用在进程空间中加载另一个程序时，当前进程的所有线程都应终止。由于LinuxThreads的局限性，该机制无法在exec中实现，因此要求线程执行exec前手工终止其他所有线程。pthread_kill_other_threads_np()的作用就是这个。

需要注意的是，pthread_kill_other_threads_np()并没有通过pthread_cancel()来终止线程，而是直接向管理线程发"进程退出"信号，使所有其他线程都结束运行，而不经过Cancel动作，当然也不会执行退出回调函数。尽管LinuxThreads的实验结果与文档说明相同，但代码实现中却是用的__pthread_sig_cancel信号来kill线程，应该效果与执行pthread_cancel()是一样的，其中原因目前还不清楚。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

POSIX线程：API 的相关文章

PDO 和 IS NOT NULL 函数

我是 PDO 新手我想知道是否有相当于 mysql 语句的语句来检查参数是否不为空例如 SELECT FROM table WHERE param IS NOT NULL 我试过这个 pdo gt prepare SELECT FROM
Groovy 中 Null Object 类的用途是什么？

我已经使用 Groovy 五个小时了刚刚发现Groovy NullObject http groovy codehaus org api index html org codehaus groovy runtime NullObject
使用 pymongo 查询空字段

我想使用 python 查询 mongo 中的空字段但是它很难处理单词 null 或 false 它要么给我错误它们在 python 中未定义要么在 mongo 中搜索字符串 null 和 false 这两种情况我都不希望发生 col
Postman如何发送请求？ ajax，同源策略

我发现了这个非常有用的 Chrome 扩展程序名为 Postman 这是一个非常有用的扩展特别是当您正在编写 RESTful 应用程序时我感到困惑的一件事是这个插件扩展如何能够在不同的域上成功发送 POST 请求我尝试像这样使用
使用 AVFoundation 快速获取视频帧

这是我的代码我想要获取我的视频并将帧数据获取到 SceneKit SCNSphere NSString videoPath NSBundle mainBundle l var videoURL NSBundle mainBundle UR
如何将 YouTube API 集成到我的 iPhone 应用程序中？

我想将 YouTube API 集成到我的应用程序中我该怎么做附注我正在为 YouTube 频道制作一个应用程序我尝试以webview 但这让一切变得更糟因为用户可以看到 YouTube 控件搜索等以及有关 YouTube i
同步和异步 API

我正在开发一个库它提供一些耗时的服务我需要每个 API 有两个版本一个用于同步函数调用另一个用于异步图书馆用户应决定使用哪个版本服务结果可能对于系统继续运行同步调用至关重要可能需要在不同的工作线程中完成相同的操作因为结果
响应中的有效 JSON

我正在开发客户端和服务器应用程序遇到了一个有趣的问题我们正在创建一个 Restful API 并通过 JSON 响应与客户端进行通信执行 DELETE 时我们将返回 200 OK 和空白响应我们的客户收到 200 OK 但解析 J
ReSharper API...呃...它在哪里？

好吧我一定正在享受金发时刻但我一生都找不到去哪里下载 ReSharper API 与我获得的项目一起使用here http devlicio us blogs hadi hariri archive 2010 01 12 writin
Alamofire 使用公共键和多个值传递参数？

我需要在我的项目中执行此操作如果我手动将字符串附加到 Alamofire 中的 URL 我可以轻松完成此操作但我不希望这样做我想要的参数为范围 object 参数的一个公共键中有多个值我一直在做什么 public func find
我们可以使用 axios 的 onDownloadProgress 来加载 API 吗？

我需要使用 axios 创建一个用于在 React 项目中加载 API 的进度条我为此发现了 onDownloadProgress 函数但我不知道我们是否可以使用它来获取诸如加载百分比之类的信息或者它是否仅用于文件下载所以我不确定我
当对象超出范围时是否会调用析构函数？

例如 int main Foo leedle new Foo return 0 class Foo private somePointer bar public Foo Foo Foo Foo delete bar 析构函数会被编译器隐式调
使用 EntityFramework 使用空参数值调用存储过程

我在 sqlserver 2008 上有一个存储过程其中一个参数接受空值我不知道如何使用参数上的空值来调用该 SP 为了获得更多上下文我正在使用 EntityFramework 6xx 在下一个示例中参数 status Compat
PayPal Rest API for Payments 在沙箱中返回 NULL

我有一个 PayPal 沙盒帐户我可以在 PHP 上使用curl 通过 api 检索令牌但是处理测试卡只会返回 null 有人看到代码有问题吗这是 PayPal 沙盒的已知问题吗下面代码片段中的客户端是伪造的但是如前所述使用我
在react.js中调用API渲染数组图片

我有 API 其中包括 pictures http storage web source images 2016 10 28 edac054f88fd16aee7bc144545fea4b2 jpg http storage web sou
为什么 VB.NET 和 C# 中针对值检查 null 存在差异？

In VB NET http en wikipedia org wiki Visual Basic NET有时候是这样的 Dim x As System Nullable Of Decimal Nothing Dim y As System
如何使用php api检查电子邮件或手机paypal帐户状态？

如何使用 php api 检查电子邮件或手机 Paypal 帐户状态好的如果我想汇款到此电子邮件贝宝 email protected cdn cgi l email protection 或手机 1234567890 汇款前我可以检查
如何在WCF Rest服务中从流上传图像

我正在尝试创建 wcf 服务该服务将上传 pdf doc xls 图像等文件但 pdf txt 文件正在上传并正确打开但是当我尝试上传图像文件时文件正在上传但是图像不可见 OperationContract WebInvoke M
使用 python 更新 Google 搜索方法

我试图使用xgoogle https github com pkrumins xgoogle但我已经 3 年没有更新了即使我设置每页 100 个结果我也只能得到不超过 5 个结果如果有人使用 xgoogle 没有任何问题请告诉我现
如何将 Live API for Contacts 的响应中的哈希值转换为文本

我集成了 Live JS api 来获取用户的实时联系人它以哈希格式 email hash 返回电子邮件我如何使用 javascript 或 c net 转换为可读文本非常感谢我遇到了同样的问题并且找到了解决方案您所需要做的就是

随机推荐

Flume 学习

开始启动flume的学习 todo
提示需要 Oracle 客户端软件 8.1.7 或更高版本解决方案

一问题 1 使用第三方接口连接Oracle数据库程序内调用接口提示需要 Oracle 客户端软件 8 1 7 或更高版本网上看了很多答案依然不起效果在公司前辈指点下终得以找到解决办法 2 数据库 Oracle 11g 二解决
HardFault_Handler异常

Cortex M3 双堆栈指针 MSP PSP Cortex M3内核中有两个堆栈指针 MSP PSP 但任何时刻只能使用到其中一个复位后处于线程模式特权级默认使用MSP 通过SP访问到的是正在使用的那个指针可以通过MSR MRS指令
mysqldump的备份和恢复

1 mysqldump的简介 mysqldump工具是mysql数据库自带的最基础的一款备份工具它的备份过程首先是从buffer中找到需要备份的数据进行备份如果buffer中没有就去磁盘中数据文件查找并缓存到buffer里再进行备份
Leetcode 题解系列--Leetcode1 两数之和

题目描述两数之和给定一个整数数组 nums 和一个目标值 target 请你在该数组中找出和为目标值的那两个整数并返回他们的数组下标你可以假设每种输入只会对应一个答案但是数组中同一个元素不能使用两遍解题思路解法一直观的
用虚拟机搭建出来的服务器和阿里云腾讯云买的服务器的区别在哪里？

讲真区别蛮大的说天壤之别也不为过我们来列举以下几个方面的差别 1 网络云平台提供的网络一般都是多线BGP 也就是说无论你现在是什么网络环境都可以保障流畅的访问而本地出于成本的考虑最多两根光纤外部访问的流畅性得不到保障 2
JS 阻止事件冒泡

冒泡事件就是你给父元素绑定了一个事件你点击子元素也会触发这个事件因为事件是向上冒泡的阻止冒泡的方法最常见的方法有两种 1 if event target this 使用这个判断就可以确定你点击的元素是否是事件触发的来源这样就会阻止
Web Socket简介

1 Web Socket 是 HTML5 的新协议允许服务器端向客户端发送数据是一种全双工双向的通信方式并且它可以保持长时间通信概念理解 1 全双工意思就是服务器向浏览器发送数据的同时浏览器也可以向服务器传递数据即同时进行信
腾讯智影+IDM进行数字人制作（无限使用）

腾讯智影 IDM进行数字人制作无限使用首先确保您电脑上有windows自带的Edge浏览器安装IDM下载工具 IDM 安装到浏览器扩展下载IDM使用工具链接 https pan baidu com s 1iARibnICpbnOR
python监听、操作键盘鼠标库pynput详细教程

0 0 0 前言监听操作鼠标键盘是实现自动化的捷径比如我实现自动化签到用到了模拟键盘操作 pynput是监听操控鼠标和键盘的跨平台第三方python库你可以通过pip insnall pynput来安装安装时会自动下载依赖库
北京五棵松：你记忆中的后备箱夜市，来了！

每个人可能都有这么一段记忆到了晚上的时候我们约好了来到了老地方逛夜市这是我们一贯的小爱好同样是逛但不同于逛商场这里的人这里的物这里的景都是生活的一部分这里有熟悉的脸也有陌生的脸他们有的坐在小凳上有的倚在墙上或
windows net user 添加用户

文章目录问题 net user 解决问题使用控制面板设置添加用户时显示成这样可能是因为 win10 家庭版的原因 net user 解决以管理员身份运行 cmd 执行 net user user name password
微调神器 Finetuner，提升 CLIP 模型性能

经证实在海量的数据集上训练的大型神经网络模型可以完成一些之前被认为是AI领域亟待攻克的问题例如正确识别猫和袋鼠的图像一直都被看作非常困难的问题但现在通过使用大型的神经网络模型已经可以很好地解决然而这些模型都是在类别广泛的数据集上
基于Matlab的差分算法优化ANN数据预测

基于Matlab的差分算法优化ANN数据预测概述人工神经网络 Artificial Neural Network ANN 是一种模拟生物神经系统工作机制的计算模型具有强大的非线性建模和预测能力然而在ANN应用于数据预测问题时常常
负载平衡策略

负载平衡软件解决方案有LVS HAProxy Nginx等以Nginx为例负载均衡有以下几种策略 1 轮询 Round Robin 根据Nginx配置文件中的顺序依次把客户端的web请求分发到不同的后端服务器如果后端服务器down掉
文件上传能通过ajax上传吗,通过ajax上传文件

我使用2个文件index js upload php尝试通过ajax上传文件 img 如果成功追加到div uploadfile show 但是它不起作用有几个问题下面我的代码有什么建议吗谢谢 upload php 1 form en
Vue脚手架的创建以及Eslint的解决

1 创建脚手架 win R cmd 打开命令行窗口运行下面代码 npm i g vue cli 2 cd Desktop 转到桌面创建项目 vue create 项目名字例如 vue create test 3 在自己写的项目中出现
MD5加密及随机数生成

今天贴两个简单的方法需要的时候不用自己再写 public static String md5 String plaintext MessageDigest m try m MessageDigest getInstance MD5 m r
grafana 表格自动刷新
POSIX线程：API

一线程创建与取消 1 线程创建 1 1 线程与进程相对进程而言线程是一个更加接近于执行体的概念它可以与同进程中的其他线程共享数据但拥有自己的栈空间拥有独立的执行序列在串行程序基础上引入线程和进程是为了提高程序的并发度从而提高

POSIX线程：API

POSIX线程：API 的相关文章

随机推荐

热门标签