網路通信基礎重難點解析 04 ：select 函數原理及重難點分析

select 函數用法

select 函數是網路通信編程中非常常用的一個函數，因此應該熟練掌握它。雖然它是 BSD 標準之一的 Socket 函數之一，但在 Linux 和 Windows 平台，其行為表現還是有點區別的。我們先來看一下 Linux 平台上的 select 函數。

Linux 平台下的 select 函數

select 函數的作用是檢測一組 socket 中某個或某幾個是否有「事件」就緒，這裡的「事件」一般分為如下三類：

讀事件就緒：

socket 內核中，接收緩衝區中的位元組數大於等於低水位標記 SO_RCVLOWAT，此時調用 recv 或 read 函數可以無阻塞的讀該文件描述符，並且返回值大於0；
TCP 連接的對端關閉連接，此時調用 recv 或 read 函數對該 socket 讀，則返回 0；
偵聽 socket 上有新的連接請求；
socket 上有未處理的錯誤。

寫事件就緒：

socket 內核中，發送緩衝區中的可用位元組數(發送緩衝區的空閑位置大?) 大於等於低水位標記 SO_SNDLOWAT，此時可以無阻塞的寫, 並且返回值大於0；
socket 的寫操作被關閉(調用了 close 或者 shutdown 函數)（對一個寫操作被關閉的 socket 進行寫操作, 會觸發 SIGPIPE 信號）；
socket 使?非阻塞 connect 連接成功或失敗之後；

異常事件就緒

socket 上收到帶外數據。

函數簽名如下：

int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);

參數說明：

參數 nfds， Linux 下 socket 也稱 fd，這個參數的值設置成所有需要使用 select 函數監聽的 fd 中最大 fd 值加 1。
參數 readfds，需要監聽可讀事件的 fd 集合。
參數 writefds，需要監聽可寫事件的 fd 集合。
參數 exceptfds，需要監聽異常事件 fd 集合。

readfds、writefds 和 exceptfds 類型都是 fd_set，這是一個結構體信息，其定義位於 /usr/include/sys/select.h 中：

/* The fd_set member is required to be an array of longs. */ typedef long int __fd_mask;

/* Some versions of <linux/posix_types.h> define this macros. */
#undef __NFDBITS
/* Its easier to assume 8-bit bytes than to get CHAR_BIT. */
#define __NFDBITS (8 * (int) sizeof (__fd_mask))
#define __FD_ELT(d) ((d) / __NFDBITS)
#define __FD_MASK(d) ((__fd_mask) 1 << ((d) % __NFDBITS))

/* fd_set for select and pselect. */
typedef struct
{
/* XPG4.2 requires this member name. Otherwise avoid the name
from the global namespace. */
#ifdef __USE_XOPEN
__fd_mask fds_bits[__FD_SETSIZE / __NFDBITS];
# define __FDS_BITS(set) ((set)->fds_bits)
#else
// 在我的centOS 7.0 系統中的值：
// __FD_SETSIZE = 1024
//__NFDBITS = 64
__fd_mask __fds_bits[__FD_SETSIZE / __NFDBITS];
# define __FDS_BITS(set) ((set)->__fds_bits)
#endif
} fd_set;

/* Maximum number of file descriptors in `fd_set. */
#define FD_SETSIZE __FD_SETSIZE

我們假設未定義宏 __USE_XOPEN，將上面的代碼整理一下：

typedef struct { long int __fds_bits[16]; } fd_set;

將一個 fd 添加到 fd_set 這個集合中需要使用 FD_SET 宏，其定義如下：

void FD_SET(int fd, fd_set *set);

其實現如下：

#define FD_SET(fd,fdsetp) __FD_SET(fd,fdsetp)

FD_SET 在內部又是通過宏 __FD_SET 來實現的，__FD_SET 的定義如下（位於 /usr/include/bits/select.h 中）：

#if defined __GNUC__ && __GNUC__ >= 2

# if __WORDSIZE == 64
# define __FD_ZERO_STOS "stosq"
# else
# define __FD_ZERO_STOS "stosl"
# endif

# define __FD_ZERO(fdsp)
do {
int __d0, __d1;
__asm__ __volatile__ ("cld; rep; " __FD_ZERO_STOS
: "=c" (__d0), "=D" (__d1)
: "a" (0), "0" (sizeof (fd_set)
/ sizeof (__fd_mask)),
"1" (&__FDS_BITS (fdsp)[0])
: "memory");
} while (0)

#else /* ! GNU CC */

/* We dont use `memset because this would require a prototype and
the array isnt too big. */
# define __FD_ZERO(set)
do {
unsigned int __i;
fd_set *__arr = (set);
for (__i = 0; __i < sizeof (fd_set) / sizeof (__fd_mask); ++__i)
__FDS_BITS (__arr)[__i] = 0;
} while (0)

#endif /* GNU CC */

#define __FD_SET(d, set)
((void) (__FDS_BITS (set)[__FD_ELT (d)] |= __FD_MASK (d)))
#define __FD_CLR(d, set)
((void) (__FDS_BITS (set)[__FD_ELT (d)] &= ~__FD_MASK (d)))
#define __FD_ISSET(d, set)
((__FDS_BITS (set)[__FD_ELT (d)] & __FD_MASK (d)) != 0)

重點看這一行：

((void) (__FDS_BITS (set)[__FD_ELT (d)] |= __FD_MASK (d)))

__FD_MASK 和 __FD_ELT 宏在上面的代碼中已經給出定義：

#define __FD_ELT(d) ((d) / __NFDBITS) #define __FD_MASK(d) ((__fd_mask) 1 << ((d) % __NFDBITS))

__NFDBITS 的值是 64 （8 * 8），也就是說 __FD_MASK (d) 先計算 fd 與 64 的餘數 n，然後執行 1 << n，這一操作實際上是將 fd 的值放在 0～63 這 64 的位置上去，這個位置索引就是 fd 與 64 取模的結果；同理 __FD_ELT(d) 就是計算位置索引值了。舉個例子，假設現在 fd 的值是 57，那麼在這 64 個位置的 57 位，其值在 64 個長度的二進位中置位是：

0000 0010 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

這個值就是 1 << (57 % 64) 得到的數字。

但是前面 fd 數組的定義是：

typedef struct { long int __fds_bits[16]; //可以看成是128 bit的數組 } fd_set;

long int 占 8 個位元組，每個位元組 8 bit，一共 16 個 long int，如果換成二進位的位( bit )就是 8 * 8 * 16 = 1024，這說明在我的機器上，select 函數支持操作的最大 fd 數量是 1024。

同理，如果我們需要從 fd_set 上刪除一個 fd，我們可以調用 FD_CLR，其定義如下：

void FD_CLR(int fd, fd_set *set);

原理和 FD_SET 相同，即將對應標誌清零即可。

如果，我們需要將 fd_set 中所有的 fd 都清掉，則使用宏 FD_ZERO：

void FD_ZERO(fd_set *set);

當 select 函數返回時，我們使用 FD_ISSET 宏來判斷某個 fd 是否有我們關心的事件，FD_ISSET 宏的定義如下：

int FD_ISSET(int fd, fd_set *set);

FD_ISSET 宏本質上就是檢測對應的位置上是否置 1，實現如下：

#define __FD_ISSET(d, set) ((__FDS_BITS (set)[__FD_ELT (d)] & __FD_MASK (d)) != 0)

提醒一下： FD_ELT 和 FD_MASK 宏前文的代碼已經給過具體實現了。

參數 timeout，超時時間，即在這個參數設定的時間內檢測這些 fd 的事件，超過這個時間後 select 函數將立即返回。這是一個 timeval 類型結構體，其定義如下：

struct timeval { long tv_sec; /* seconds */ long tv_usec; /* microseconds */ };

select 函數的總超時時間是 timeout->tv_sec 和 timeout->tv_usec 之和，前者的時間單位是秒，後者的時間單位是微秒。

說了這麼多理論知識，我們先看一個具體的示例：

/** * select函數示例，server端, select_server.cpp * zhangyl 2018.12.24 */ #include <sys/types.h> #include <sys/socket.h> #include <arpa/inet.h> #include <unistd.h> #include <iostream> #include <string.h> #include <sys/time.h> #include <vector> #include <errno.h>

//自定義代表無效fd的值
#define INVALID_FD -1

int main(int argc, char* argv[])
{
//創建一個偵聽socket
int listenfd = socket(AF_INET, SOCK_STREAM, 0);
if (listenfd == -1)
{
std::cout << "create listen socket error." << std::endl;
return -1;
}

//初始化伺服器地址
struct sockaddr_in bindaddr;
bindaddr.sin_family = AF_INET;
bindaddr.sin_addr.s_addr = htonl(INADDR_ANY);
bindaddr.sin_port = htons(3000);
if (bind(listenfd, (struct sockaddr *)&bindaddr, sizeof(bindaddr)) == -1)
{
std::cout << "bind listen socket error." << std::endl;
close(listenfd);
return -1;
}

//啟動偵聽
if (listen(listenfd, SOMAXCONN) == -1)
{
std::cout << "listen error." << std::endl;
close(listenfd);
return -1;
}

//存儲客戶端socket的數組
std::vector<int> clientfds;
int maxfd = listenfd;

while (true)
{
fd_set readset;
FD_ZERO(&readset);

//將偵聽socket加入到待檢測的可讀事件中去
FD_SET(listenfd, &readset);

//將客戶端fd加入到待檢測的可讀事件中去
int clientfdslength = clientfds.size();
for (int i = 0; i < clientfdslength; ++i)
{
if (clientfds[i] != INVALID_FD)
{
FD_SET(clientfds[i], &readset);
}
}

timeval tm;
tm.tv_sec = 1;
tm.tv_usec = 0;
//暫且只檢測可讀事件，不檢測可寫和異常事件
int ret = select(maxfd + 1, &readset, NULL, NULL, &tm);
if (ret == -1)
{
//出錯，退出程序。
if (errno != EINTR)
break;
}
else if (ret == 0)
{
//select 函數超時，下次繼續
continue;
} else {
//檢測到某個socket有事件
if (FD_ISSET(listenfd, &readset))
{
//偵聽socket的可讀事件，則表明有新的連接到來
struct sockaddr_in clientaddr;
socklen_t clientaddrlen = sizeof(clientaddr);
//4. 接受客戶端連接
int clientfd = accept(listenfd, (struct sockaddr *)&clientaddr, &clientaddrlen);
if (clientfd == -1)
{
//接受連接出錯，退出程序
break;
}

//只接受連接，不調用recv收取任何數據
std:: cout << "accept a client connection, fd: " << clientfd << std::endl;
clientfds.push_back(clientfd);
//記錄一下最新的最大fd值，以便作為下一輪循環中select的第一個參數
if (clientfd > maxfd)
maxfd = clientfd;
}
else
{
//假設對端發來的數據長度不超過63個字元
char recvbuf[64];
int clientfdslength = clientfds.size();
for (int i = 0; i < clientfdslength; ++i)
{
if (clientfds[i] != -1 && FD_ISSET(clientfds[i], &readset))
{
memset(recvbuf, 0, sizeof(recvbuf));
//非偵聽socket，則接收數據
int length = recv(clientfds[i], recvbuf, 64, 0);
if (length <= 0 && errno != EINTR)
{
//收取數據出錯了
std::cout << "recv data error, clientfd: " << clientfds[i] << std::endl;
close(clientfds[i]);
//不直接刪除該元素，將該位置的元素置位-1
clientfds[i] = INVALID_FD;
continue;
}

std::cout << "clientfd: " << clientfds[i] << ", recv data: " << recvbuf << std::endl;
}
}

}
}
}

//關閉所有客戶端socket
int clientfdslength = clientfds.size();
for (int i = 0; i < clientfdslength; ++i)
{
if (clientfds[i] != INVALID_FD)
{
close(clientfds[i]);
}
}

//關閉偵聽socket
close(listenfd);

return 0;
}

我們編譯並運行程序：

[root@localhost testsocket]# g++ -g -o select_server select_server.cpp [root@localhost testsocket]# ./select_server

然後，我們再多開幾個 shell 窗口，我們這裡不再專門編寫客戶端程序了，我們使用 Linux 下的 nc 指令模擬出兩個客戶端。

shell 窗口1，連接成功以後發送字元串 hello123：

[root@localhost ~]# nc -v 127.0.0.1 3000 Ncat: Version 6.40 ( http://nmap.org/ncat ) Ncat: Connected to 127.0.0.1:3000. hello123

shell 窗口2，連接成功以後發送字元串 helloworld：

[root@localhost ~]# nc -v 127.0.0.1 3000 Ncat: Version 6.40 ( http://nmap.org/ncat ) Ncat: Connected to 127.0.0.1:3000. helloworld

此時伺服器端輸出結果如下：