线程同步概念

2023-10-29

带着问题去思考：

什么是线程同步
线程同步能解决哪些问题
如何实现线程同步

线程同步是指两个或多个线程协同步调，按预期的顺序执行代码
若两个或多个线程同时写同一块内存或访问同一资源时，需线程同步
若线程A的执行依赖线程B的结果，需线程同步（输出A1B2C3问题）

解决：

保证数据完整性，解决内存写覆盖，资源并发访问冲突/异常问题
保证线程执行先后顺序，解决线程间先后执行的问题

实现线程同步的方式：
临界区对象、互斥锁、自旋锁、信号量、事件、条件变量

临界区对象：用户态对象，用于单个线程取得对某个数据区的访问权限
互斥锁：内核态对象，用于某个进程的单个线程取得对某个数据区的访问权限，可用于多进程同步
自旋锁：改进的互斥锁，线程在等待时不交回CPU控制权
信号量：内核态对象，用于资源计数的线程同步方式，可允许指定个数的线程取得对某个数据区的访问权限
事件：内核态对象，用来发信号通知其他线程，保证线程的先后执行
条件变量：一个可自定义的线程同步对象，即可实现取得对某个数据的访问权限，又可用于通知其他线程

1. 基本概念

种进程或线程同步互斥的控制方法

临界区：通过对多线程的串行化来访问公共资源或一段代码，速度快，适合控制数据访问。
互斥量/互斥锁：为协调共同对一个共享资源的单独访问而设计的；因为进入内核模式，所以性能比临界区差；跨进程，可用于防止程序重复打开运行。
自旋锁：一种互斥锁的实现，等待的时候会占用CPU，通过循环判断锁是否被释放，因此比较快速，但是一直占用CPU时间。
信号量：为控制一个具有有限数量用户资源而设计，互斥锁可以理解为1个用户资源的信号量。
事件：用来通知线程有一些事件已发生，从而启动后继任务的开始。
条件变量：条件变量是利用线程间共享的全局变量进行同步的一种机制，主要包括两个动作：一个线程等待"条件变量的条件成立"而挂起；另一个线程使"条件成立"（给出条件成立信号）。

几个概念：

临界区、竞态条件：当两个线程竞争同一资源时，如果对资源的访问顺序敏感，就称存在竞态条件；导致竞态条件发生的代码区称作临界区。

2. VC++下的4种线程同步方式

2.1 临界区(Critical Section)

保证在某一时刻只有一个线程能访问数据的简便办法。在任意时刻只允许一个线程对共享资源进行访问。如果有多个线程试图同时访问临界区，那么在有一个线程进入后其他所有试图访问此临界区的线程将被挂起，并一直持续到进入临界区的线程离开。临界区在被释放后，其他线程可以继续抢占，并以此达到用原子方式操作共享资源的目的。

临界区包含两个操作原语：

EnterCriticalSection() // 进入临界区
LeaveCriticalSection() // 离开临界区

EnterCriticalSection()语句执行后代码将进入临界区以后无论发生什么，必须确保与之匹配的 LeaveCriticalSection()都能够被执行到。否则临界区保护的共享资源将永远不会被释放。虽然临界区同步速度很快，但却只能用来同步本进程内的线程，而不可用来同步多个进程中的线程。

MFC提供了很多功能完备的类，我用MFC实现了临界区。MFC为临界区提供有一个 CCriticalSection类，使用该类进行线程同步处理是非常简单的。只需在线程函数中用CCriticalSection类成员函数Lock()和UnLock()标定出被保护代码片段即可。Lock()后代码用到的资源自动被视为临界区内的资源被保护。UnLock后别的线程才能访问这些资源。

临界区示例（头文件Window.h）：

CRITICAL_SECTION mCriticalSection; // 定义
InitializeCriticalSection(&mCriticalSection); // 初始化
EnterCriticalSection(&mCriticalSection); // 进入临界区
LeaveCriticalSection(&mCriticalSection); // 离开临界区
DeleteCriticalSection(&mCriticalSection); // 删除

2.2互斥量/互斥锁(Mutex)

互斥量跟临界区很相似，只有拥有互斥对象的线程才具有访问资源的权限，由于互斥对象只有一个，因此就决定了任何情况下此共享资源都不会同时被多个线程所访问。当前占据资源的线程在任务处理完后应将拥有的互斥对象交出，以便其他线程在获得后得以访问资源。互斥量比临界区复杂。因为使用互斥不仅仅能够在同一应用程序不同线程中实现资源的安全共享，而且可以在不同应用程序的线程之间实现对资源的安全共享。
互斥量包含的几个操作原语：

CreateMutex()   // 创建一个互斥量
OpenMutex()     // 打开一个互斥量
ReleaseMutex()  // 释放互斥量
WaitForMultipleObjects()    // 等待互斥量对象

同样MFC为互斥量提供有一个CMutex类。使用CMutex类实现互斥量操作非常简单，但是要特别注意对CMutex的构造函数的调用

CMutex( BOOL bInitiallyOwn = FALSE, LPCTSTR lpszName = NULL, LPSECURITY_ATTRIBUTES lpsaAttribute = NULL)

不用的参数不能乱填，乱填会出现一些意想不到的运行结果。

2.3 信号量(Semaphores)

信号量对象对线程的同步方式与前面几种方法不同，信号允许多个线程同时使用共享资源，这与操作系统中的PV操作相同。它指出了同时访问共享资源的线程最大数目。它允许多个线程在同一时刻访问同一资源，但是需要限制在同一时刻访问此资源的最大线程数目。在用CreateSemaphore()创建信号量时即要同时指出允许的最大资源计数和当前可用资源计数。一般是将当前可用资源计数设置为最大资源计数，每增加一个线程对共享资源的访问，当前可用资源计数就会减1，只要当前可用资源计数是大于0的，就可以发出信号量信号。但是当前可用计数减小到0时则说明当前占用资源的线程数已经达到了所允许的最大数目，不能在允许其他线程的进入，此时的信号量信号将无法发出。线程在处理完共享资源后，应在离开的同时通过ReleaseSemaphore()函数将当前可用资源计数加1。在任何时候当前可用资源计数决不可能大于最大资源计数。

PV操作及信号量的概念都是由荷兰科学家E.W.Dijkstra提出的。信号量S是一个整数，S大于等于零时代表可供并发进程使用的资源实体数，但S小于零时则表示正在等待使用共享资源的进程数。
P操作申请资源：

(1) S减1；

(2) 若S减1后仍大于等于零，则进程继续执行；

(3) 若S减1后小于零，则该进程被阻塞后进入与该信号相对应的队列中，然后转入进程调度。
V操作释放资源：

(1) S加1；

(2) 若相加结果大于零，则进程继续执行；

(3) 若相加结果小于等于零，则从该信号的等待队列中唤醒一个等待进程，然后再返回原进程继续执行或转入进程调度。

信号量包含的几个操作原语：

CreateSemaphore()   // 创建一个信号量
OpenSemaphore()     // 打开一个信号量
ReleaseSemaphore()  // 释放信号量
WaitForSingleObject()   // 等待信号量

2.4 事件(Event)

事件对象也可以通过通知操作的方式来保持线程的同步。并且可以实现不同进程中的线程同步操作。
信号量包含的几个操作原语：

CreateEvent()   // 创建一个事件
OpenEvent()     // 打开一个事件
SetEvent()      // 回置事件
WaitForSingleObject()       // 等待一个事件
WaitForMultipleObjects()    // 等待多个事件

WaitForMultipleObjects 函数原型：

WaitForMultipleObjects(
    IN DWORD nCount,            // 等待句柄数
    IN CONST HANDLE *lpHandles, // 指向句柄数组
    IN BOOL bWaitAll,           // 是否完全等待标志
    IN DWORD dwMilliseconds     // 等待时间
)

参数nCount指定了要等待的内核对象的数目，存放这些内核对象的数组由lpHandles来指向。fWaitAll对指定的这nCount个内核对象的两种等待方式进行了指定，为TRUE时当所有对象都被通知时函数才会返回，为FALSE则只要其中任何一个得到通知就可以返回。 dwMilliseconds在这里的作用与在WaitForSingleObject()中的作用是完全一致的。如果等待超时，函数将返回 WAIT_TIMEOUT。

3. pthread种条件变量的使用

/*

pthread 条件变量学习

条件变量是利用线程间共享的全局变量进行同步的一种机制，主要包括两个动作：一个线程等待"条件变量的条件成立"而挂起；
另一个线程使"条件成立"（给出条件成立信号）。为了防止竞争，条件变量的使用总是和一个互斥锁结合在一起。

1. 创建和注销
静态创建方法： pthread_cond_t   cond=PTHREAD_COND_INITIALIZER
动态调用pthread_cond_init()函数

注销：pthread_cond_destroy()

2. 等待和激发
// 无条件等待
int pthread_cond_wait(pthread_cond_t   *cond,   pthread_mutex_t   *mutex)   
// 计时等待，超时退出等待
int pthread_cond_timedwait(pthread_cond_t   *cond,   pthread_mutex_t   *mutex,   const   struct   timespec   *abstime) 

// 激活一个等待的线程
pthread_cond_signal()
// 激活全部等待的线程
pthread_cond_broadcast()

*/
#include <pthread.h>
#include <unistd.h>

static pthread_mutex_t mtx = PTHREAD_MUTEX_INITIALIZER;
static pthread_cond_t cond = PTHREAD_COND_INITIALIZER;

struct node
{
    int n_number;
    struct node *n_next;
} *head = NULL;

/*[thread_func]*/
static void cleanup_handler(void *arg)
{
    printf("Cleanup handler of second thread./n");
    free(arg);
    (void)pthread_mutex_unlock(&mtx);
}

static void *thread_func(void *arg)
{
    struct node *p = NULL;

    pthread_cleanup_push(cleanup_handler, p);
    while (1)
    {
        pthread_mutex_lock(&mtx); //这个mutex主要是用来保证pthread_cond_wait的并发性
        while (head == NULL)
        {                                   //这个while要特别说明一下，单个pthread_cond_wait功能很完善，为何这里要有一个while (head == NULL)呢？因为pthread_cond_wait里的线程可能会被意外唤醒，如果这个时候head != NULL，则不是我们想要的情况。这个时候，应该让线程继续进入pthread_cond_wait
            pthread_cond_wait(&cond, &mtx); // pthread_cond_wait会先解除之前的pthread_mutex_lock锁定的mtx，然后阻塞在等待对列里休眠，直到再次被唤醒（大多数情况下是等待的条件成立而被唤醒，唤醒后，该进程会先锁定先pthread_mutex_lock(&mtx);，再读取资源
                                            //用这个流程是比较清楚的/*lock-->unlock-->wait() return-->lock*/
        }
        p = head;
        head = head->n_next;
        printf("Got %d from front of queue/n", p->n_number);
        free(p);
        pthread_mutex_unlock(&mtx); //临界区数据操作完毕，释放互斥锁
    }
    pthread_cleanup_pop(0);
    return 0;
}

int main(void)
{
    pthread_t tid;
    int i;
    struct node *p;
    pthread_create(&tid, NULL, thread_func, NULL); //子线程会一直等待资源，类似生产者和消费者，但是这里的消费者可以是多个消费者，而不仅仅支持普通的单个消费者，这个模型虽然简单，但是很强大
    /*[tx6-main]*/
    for (i = 0; i < 10; i++)
    {
        p = malloc(sizeof(struct node));
        p->n_number = i;
        pthread_mutex_lock(&mtx); //需要操作head这个临界资源，先加锁，
        p->n_next = head;
        head = p;
        pthread_cond_signal(&cond);
        pthread_mutex_unlock(&mtx); //解锁
        sleep(1);
    }
    printf("thread 1 wanna end the line.So cancel thread 2./n");
    pthread_cancel(tid); //关于pthread_cancel，有一点额外的说明，它是从外部终止子线程，子线程会在最近的取消点，退出线程，而在我们的代码里，最近的取消点肯定就是pthread_cond_wait()了。关于取消点的信息，有兴趣可以google,这里不多说了
    pthread_join(tid, NULL);
    
    // 激活全部等待的线程
    // pthread_cond_broadcast(&cond);
    printf("All done -- exiting/n");
    return 0;
}

3. 总结

互斥量/互斥锁与临界区的作用非常相似，但互斥量是可以命名的，也就是说它可以跨越进程使用。所以创建互斥量需要的资源更多，所以如果只为了在进程内部是用的话使用临界区会带来速度上的优势并能够减少资源占用量。因为互斥量是跨进程的互斥量一旦被创建，就可以通过名字打开它。
互斥量(Mutex)，信号量(Semaphore)，事件(Event)都可以被跨越进程使用来进行同步数据操作，而其他的对象与数据同步操作无关，但对于进程和线程来讲，如果进程和线程在运行状态则为无信号状态，在退出后为有信号状态。所以可以使用WaitForSingleObject来等待进程和线程退出。
通过互斥量可以指定资源被独占的方式使用，但如果有下面一种情况通过互斥量就无法处理，比如现在一位用户购买了一份三个并发访问许可的数据库系统，可以根据用户购买的访问许可数量来决定有多少个线程/进程能同时进行数据库操作，这时候如果利用互斥量就没有办法完成这个要求，信号量对象可以说是一种资源计数器。

关于更详细的一篇介绍，请参考：
http://www.cppblog.com/killsound/archive/2009/07/15/16147.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CC