TCP编程入门简介
在前几篇文章中,我们先从宏观角度(TCP 概述)大致介绍了 tcp 的概念,然后从微观角度(滑动窗口、拥塞窗口等)详细说明了从 client 端和 server 端,tcp 是如何进行网络控制的。在本文中,我们将通过一个 tcp 例子,将整个过程联通起来,讲解 tcp 从连接、发送以及关闭,整个流程是怎样运行的。
示例代码
server.c
#include
#include
#include
#include
#include
#include
int main(int argc, char **) {
int server_fd, new_socket, valread;
struct sockaddr_in address;
int opt = 1;
int addrlen = sizeof(address);
char buffer[1024] = {0};
char *hello = "hello from server";
int port = 8080;
// 创建socket文件描述符
if ((server_fd = socket(AF_INET, SOCK_STREAM, 0)) == 0) {
return 1;
}
// 端口 & 地址复用
if (setsockopt(server_fd, SOL_SOCKET, SO_REUSEADDR | SO_REUSEPORT,
&opt, sizeof(opt))) {
return 1;
}
address.sin_family = AF_INET;
address.sin_addr.s_addr = INADDR_ANY;
address.sin_port = htons( port );
// 绑定8080端口
if (bind(server_fd, (struct sockaddr *)&address,
sizeof(address))<0) {
perror("bind failed");
return 1;
}
if (listen(server_fd, 3) < 0) {
return 1;
}
if ((new_socket = accept(server_fd, (struct sockaddr *)&address,
(socklen_t*)&addrlen))<0) {
return 1;
}
valread = read( new_socket , buffer, 1024);
// 向client发送消息
send(new_socket , hello , strlen(hello) , 0 );
close(new_socket);
close(server_fd);
return 0;
}
client.c
#include
#include
#include
#include
#include
int main(int argc, char const *argv[]) {
int sock = 0, valread;
struct sockaddr_in serv_addr;
char *hello = "hello from client";
char buffer[1024] = {0};
int port = 8080;
if ((sock = socket(AF_INET, SOCK_STREAM, 0)) < 0) { return -1;
}
serv_addr.sin_family = AF_INET;
serv_addr.sin_port = htons(port);
if(inet_pton(AF_INET, "127.0.0.1", &serv_addr.sin_addr)<=0) {
return 1;
}
// 建立连接
if (connect(sock, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) < 0) {
return 1;
}
send(sock , hello , strlen(hello) , 0 );
valread = read( sock , buffer, 1024);
close(sock);
return 0;
}
上面是 tcp 的示例代码,很简单,算是网络编程的入门级代码。读者可以使用下面命令进行编译:
gcc -g server.c -o server
gcc -g client.c -o client
过程分析
下面,我们分析前面的示例代码, 对于 server 端:
1、创建 socket
2、bind 端口
3、listen
4、accept 新的连接,获取新连接的 socket
5、通过 read 函数,接收数据
6、通过 send 函数,发送数据
7、调用 close 函数关闭 socket
对于 client 端:
1、创建 socket
2、通过 connect 与 server 端建立连接
3、通过 send 发送数据
4、通过 recv 接收数据
5、close socket
对于 server 端和 client 端的每个步骤,其都是有关联的,比如 client 端调用 connect 之后,server 端将从 accept 函数返回,其返回值是新连接的 socket 等等。下面,我们将以一个图的方式来了解两端的联系。
详述
socket()
#include
int socket (int domain, int type, int protocol);
socket 系统调用通过分配一个新的描述符来创建一个新的套接字。它唯一标识一个 socket。这个 socket 描述字跟文件描述字一样,后续的操作都有用到它,把它作为参数,通过它来进行一些读写操作。成功时返回一个非负的文件描述符编号,错误时返回-1。
domain:即协议域,又称为协议族(family)。常用的协议族有,AF_INET(IPv4)、AF_INET6(IPv6)、AF_LOCAL(或称 AF_UNIX,Unix 域 socket)、AF_ROUTE 等等。 type:指定 socket 类型。常用的 socket 类型有,SOCK_STREAM(流式套接字)、SOCK_DGRAM(数据报式套接字)、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET 等等 protocol:就是指定协议。常用的协议有,IPPROTO_TCP、PPTOTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC 等,它们分别对应 TCP 传输协议、UDP 传输协议、STCP 传输协议、TIPC 传输协议。
在此,需要注意的是,并不是上面的 type 和 protocol 可以随意组合的,如 SOCK_STREAM 不可以跟 IPPROTO_UDP 组合。当 protocol 为 0 时,会自动选择 type 类型对应的默认协议。由于数据流的 IP 协议就是 TCP,前两个参数已经有效地指定了 TCP。因此,第三个参数可以保留为 0,让操作系统分配一个默认协议(这将是 IPPROTO_TCP)。
bind()
#include /* See NOTES */
#include
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
bind 函数用来绑定 socket 的本地地址和端口号。
sockfd 是待绑定的 socket 对应的文件描述符。 addr 一个 const struct sockaddr *指针,指向要绑定给 sockfd 的协议地址。 addrlen 必须是结构体的大小 sockaddr_in(或正在使用的任何结构)。
struct in_addr {
u_int32_t s_addr;
};
struct sockaddr_in {
short sin_family;
u_short sin_port;
struct in_addr sin_addr;
char sin_zero[8];
};
sin_port 指定要使用的 16 位端口号。它在网络中给出(大端)字节顺序,因此必须使用 htons 将主机字节顺序转换为网络字节顺序。
将 sin 端口值指定为 0 会告诉操作系统选择端口号。操作系统将在 1024 和 5000 之间选择一个未使用的端口号作为应用程序。注意只有超级用户才能绑定 1024 以下的端口号。
对于 bind 系统调用,此处需要注意的是,在 client 不需要强制调用,而在 server 端需要强制调用,这是因为,在 server 端,bind 之后,要进行端口监听。而在 client 端,如果代码中没有执行此系统调用,则在内核中会隐式执行此调用。
connect()
#include /* See NOTES */
#include
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
通过执行 connect 函数,与 server 端建立连接。
sockfd socket 对应的文件描述符。 addr 指定了对端的 ip 和端口。 addrlen 指定了上面结构体的大小
经典的三次握手,就在 connect 阶段,如下图:
listen()
#include /* See NOTES */
#include
int listen(int sockfd, int backlog);
listen() 函数的主要作用就是将套接字( sockfd )变成被动的连接监听套接字(被动等待客户端的连接),至于参数 backlog 的作用是设置内核中连接队列的长度(该参数在现在大部分系统中已经不被使用),listen()的作用仅仅告诉内核一些信息。成功返回 0,否则返回-1.
sockfd 是绑定到要接受的端口的未连接套接字连接。 backlog 以前指定了操作系统在应用程序之前接受的连接数。现在这个值已经没用了。
这里需要注意的是,listen()函数不会阻塞,它主要做的事情为,将该套接字和套接字对应的连接队列长度告诉 Linux 内核,然后,listen()函数就结束。
accept()
#include /* See NOTES */
#include
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
accept()函数功能是,从处于 established 状态的连接队列头部取出一个已经完成的连接,如果这个队列没有已经完成的连接,accept()函数就会阻塞,直到取出队列中已完成的用户连接为止。如果没有客户端连接,accept 将阻塞直到一个 做。错误返回 -1。
sockfd 指的是上面绑定以及 listen 的 socket 描述符 addr 在有连接过来的时候,里面的内容就是 client 端的信息 addrlen 上一个变量的长度
需要注意的是,accept 的功能并不是建立连接,而是从当前连接的等待队列中获取一条连接。
accept 的第一个参数为服务器的 socket 描述字,是服务器开始调用 socket()函数生成的,称为监听 socket 描述字;而 accept 函数返回的是已连接的 socket 描述字。一个服务器通常通常仅仅只创建一个监听 socket 描述字,它在该服务器的生命周期内一直存在。内核为每个由服务器进程接受的客户连接创建了一个已连接 socket 描述字,当服务器完成了对某个客户的服务,相应的已连接 socket 描述字就被关闭。
send()
#include
#include
ssize_t send(int sockfd, const void *buf, size_t len, int flags);
向指定 socket 发送数据。
sockfd 指定 socket 描述符 buf 待发送的数据 buf len 数据 buf 长度 flags 发送标记。其值为 MSG_CONFIRM MSG_DONTROUTE MSG_DONTWAIT MSG_EOR MSG_MORE MSG_NOSIGNAL MSG_OOB 中 1 个或者几个的逻辑或或者逻辑与值
对于 send()的详细讲解,请转阅TCP之send&recv
recv()
#include
#include
ssize_t recv(int sockfd, void *buf, size_t len, int flags);
从指定socket中读取数据。
sockfd 指定 socket 描述符 buf 接收数据 buf len 接收数据buf 长度 flags 发送标记。其值为 MSG_CMSG_CLOEXEC MSG_DONTWAIT MSG_ERRQUEUE MSG_OOB MSG_PEEK MSG_TRUNC MSG_WAITALL 中 1 个或者几个的逻辑或或者逻辑与值
对于 recv()的详细讲解,请转阅TCP之send&recv
close()
#include
int close(int fd);
关闭socket。
fd为待关闭的文件描述符
close 一个套接字的默认行为是把套接字标记为已关闭,然后立即返回到调用进程,该套接字描述符不能再由调用进程使用,也就是说它不能再作为send或recv的第一个参数,然而TCP将尝试发送已排队等待发送到对端,发送完毕后发生的是正常的TCP连接终止序列。在多进程并发服务器中,父子进程共享着套接字,套接字描述符引用计数记录着共享着的进程个数,当父进程或某一子进程close掉套接字时,描述符引用计数会相应的减一,当引用计数仍大于零时,这个close调用就不会引发TCP的四路握手断连过程。四次挥手就在这个步骤。
END