Tomcat 组成与工作原理
点击上方“程序员大白”,选择“星标”公众号
重磅干货,第一时间送达
来自:掘金,作者:VectorJin
链接:https://juejin.cn/post/6844903473482317837
Tomcat 是什么
Servlet 容器
Tomcat 组成如下图:主要有 Container 和 Connector 以及相关组件构成。
Server:指的就是整个 Tomcat 服 务器,包含多组服务,负责管理和 启动各个 Service,同时监听 8005 端口发过来的 shutdown 命令,用于关闭整个容器;
Service:Tomcat 封装的、对外提供完整的、基于组件的 Web 服务, 包含 Connectors、Container 两个核心组件,以及多个功能组件,各个 Service 之间是独立的,但是共享 同一 JVM 的资源;
Connector:Tomcat 与外部世界的连接器,监听固定端口接收外部请求,传递给 Container,并将 Container 处理的结果返回给外部;
Container:Catalina,Servlet 容器,内部有多层容器组成,用于管理 Servlet 生命周期,调用 servlet 相关方法;
Loader:封装了 Java ClassLoader,用于 Container 加载类文件;
Realm:Tomcat 中为 Web 应用程序提供访问认证和角色管理的机制;
JMX:Java SE 中定义技术规范,是一个为应用程序、设备、系统等植入管理功能的框架,通过 JMX 可以远程监控 Tomcat 的运行状态;
Jasper:Tomcat 的 JSP 解析引擎,用于将 JSP 转换成 Java 文件,并编译成 class 文件。
Session:负责管理和创建 Session,以及 Session 的持久化(可自定义),支持 Session 的集 群。
Pipeline:在容器中充当管道的作用,管道中可以设置各种 valve(阀门),请求和响应在经由管道中各个阀门处理,提供了一种灵活可配置的处理请求和响应的机制。
Naming:命名服务,JNDI, Java 命名和目录接口,是一组在 Java 应用中访问命名和目录服务的 API。命名服务将名称和对象联系起来,使得我们可以用名称访问对象,目录服务也是一种命名 服务,对象不但有名称,还有属性。Tomcat 中可以使用 JNDI 定义数据源、配置信息,用于开发与部署的分离。
Engine:Servlet 的顶层容器,包含一 个或多个 Host 子容器;
Host:虚拟主机,负责 Web 应用的部 署和 Context 的创建;
Context:Web 应用上下文,包含多个 Wrapper,负责 Web 配置的解析、管 理所有的 Web 资源;
Wrapper:最底层的容器,是对 Servlet 的封装,负责 Servlet 实例的创 建、执行和销毁。
EngineConfig:主要打印启动和停止日志
HostConfig:主要处理部署应用,解析应用 META-INF/context.xml 并创建应用的 Context
ContextConfig:主要解析并合并 web.xml,扫描应用的各类 Eeb 资源(filter、servlet、listener)
List
> results = new ArrayList >();
for (int i = 0; i < children.length; i++) {
results.add(startStopExecutor.submit(new StartChild(children[i])));
}
boolean fail = false;
for (Futureresult :results) {
try {
result.get();
} catch (Exception e) {
log.error(sm.getString("containerBase.threadedStartFailed"), e);
fail = true;
}
}
catalina.home:安装目录
catalina.base:工作目录
默认值:user.dir
Server.xml 配置 Host 元素,指定 appBase 属性,默认 $catalina.base/webapps/
Server.xml 配置 Context 元素,指定 docBase,元素,指定 Web 应用的路径
自定义配置在 $catalina.base/EngineName/HostName/XXX.xml 配置 Context 元素
扫描 appbase 路径下的所有文件夹和 war 包,解析各个应用的 META-INF/context.xml,并创建 StandardContext,并将 Context 加入到 Host 的子容器中。
解析 $catalina.base/EngineName/HostName/ 下的所有 Context 配置,找到相应 Web 应用的位置,解析各个应用的 META-INF/context.xml,并创建 StandardContext,并将 Context 加入到 Host 的子容器中。
HostConfig 并没有实际解析 Context.xml,而是在 ContextConfig 中进行的。
HostConfig 中会定期检查 watched 资源文件(context.xml 配置文件)
先解析全局的配置 config/context.xml
然后解析 Host 的默认配置 EngineName/HostName/context.xml.default
最后解析应用的 META-INF/context.xml
先解析全局的配置 config/web.xml
然后解析 Host 的默认配置 EngineName/HostName/web.xml.default 接着解析应用的 MEB-INF/web.xml
扫描应用 WEB-INF/lib/ 下的 jar 文件,解析其中的 META-INF/web-fragment.xml 最后合并 xml 封装成 WebXml,并设置 Context
扫描 Web 应用和 jar 中的注解(Filter、Listener、Servlet)就是上述步骤中进行的。
容器的定期执行:backgroundProcess,由 ContainerBase 来实现的,并且只有在顶层容器中才会开启线程。(backgroundProcessorDelay=10 标志位来控制)
请求到达 server 端,server 根据 url 映射到相应的 Servlet
判断 Servlet 实例是否存在,不存在则加载和实例化 Servlet 并调用 init 方法
Server 分别创建 Request 和 Response 对象,调用 Servlet 实例的 service 方法(service 方法内部会根据 http 请求方法类型调用相应的 doXXX 方法)
doXXX 方法内为业务逻辑实现,从 Request 对象获取请求参数,处理完毕之后将结果通过 response 对象返回给调用方
当 Server 不再需要 Servlet 时(一般当 Server 关闭时),Server 调用 Servlet 的 destroy() 方法。
根据 server.xml 配置的指定的 connector 以及端口监听 http、或者 ajp 请求
请求到来时建立连接,解析请求参数,创建 Request 和 Response 对象,调用顶层容器 Pipeline 的 invoke 方法
容器之间层层调用,最终调用业务 servlet 的 service 方法
Connector 将 response 流中的数据写到 socket 中
JSP引擎
编译阶段:servlet 容器编译 servlet 源文件,生成 servlet 类
初始化阶段:加载与 JSP 对应的 servlet 类,创建其实例,并调用它的初始化方法
执行阶段:调用与 JSP 对应的 servlet 实例的服务方法
销毁阶段:调用与 JSP 对应的 servlet 实例的销毁方法,然后销毁 servlet 实例
代码片段:<% 代码片段 %>
JSP声明:<%! declaration; [ declaration; ]+ ... %>
JSP表达式:<%= 表达式 %>
JSP注释:<%-- 注释 --%>
JSP指令:<%@ directive attribute=“value” %>
JSP行为:
HTML元素:html/head/body/div/p/……
JSP隐式对象:request、response、out、session、application、config、 pageContext、page、Exception
代码片段:包含任意量的 Java 语句、变量、方法或表达式
JSP 声明:一个声明语句可以声明一个或多个变量、方法,供后面的 Java 代码使用
JSP 表达式:输出 Java 表达式的值,String 形式;
JSP 注释:为代码作注释以及将某段代码注释掉
JSP 指令:用来设置与整个 JSP 页面相关的属性:
<%@ page ... %> 定义页面的依赖属性,比如 language、contentType、errorPage、 isErrorPage、import、isThreadSafe、session 等等
<%@ include ... %> 包含其他的 JSP 文件、HTML 文件或文本文件,是该 JSP 文件的一部分,会被同时编译执行
<%@ taglib ... %> 引入标签库的定义,可以是自定义标签
JSP 行为:jsp:include、jsp:useBean、jsp:setProperty、jsp:getProperty、jsp:forward
代码片段:在 _jspService() 方法内直接输出
JSP 声明:在 servlet 类中进行输出
JSP 表达式:在 _jspService() 方法内直接输出
JSP 注释:直接忽略,不输出
JSP 指令:根据不同指令进行区分,include:对引入的文件进行解析;page 相关的属性会做为 JSP 的属性,影响的是解析和请求处理时的行为
JSP 行为:不同的行为有不同的处理方式,jsp:useBean 为例,会从 pageContext 根据 scope 的 类别获取 bean 对象,如果没有会创建 bean,同时存到相应 scope 的 pageContext 中
HTML:在 _jspService() 方法内直接输出
JSP 隐式对象:在 _jspService() 方法会进行声明,只能在方法中使用
Connector
HTTP,HTTP 是超文本传输协议,是客户端浏览器或其他程序与 Web 服务器之间的应用层通信协议
AJP,Apache JServ 协议(AJP)是一种二进制协议,专门代理从 Web 服务器到位于后端的应用程序服务器的入站请求
JIO:用 java.io 编写的 TCP 模块,阻塞IO
NIO:用 java.nio 编写的 TCP 模块,非阻塞 IO,(IO 多路复用)
APR:全称 Apache Portable Runtime,使用 JNI 的方式来进行读取文件以及进行网络传输
Support Polling:是否支持基于 IO 多路复用的 socket 事件轮询
Polling Size:轮询的最大连接数
Wait for next Request:在等待下一个请求时,处理线程是否释放,BIO 是没有释放的,所以在 keep-alive=true 的情况下处理的并发连接数有限
Read Request Headers:由于 request header 数据较少,可以由容器提前解析完毕,不需要阻塞
Read Request Body:读取 request body 的数据是应用业务逻辑的事情,同时 Servlet 的限制,是需要阻塞读取的
Write Response:跟读取 request body 的逻辑类似,同样需要阻塞写
Begin:新的请求连接接入调用,可进行与 Request 和 Response 相关的对象初始化操作,并保存 response 对象,用于后续写入数据
Read:请求连接有数据可读时调用
End:当数据可用时,如果读取到文件结束或者 response 被关闭时则被调用
Error:在连接上发生异常时调用,数据读取异常、连接断开、处理异常、socket 超时
Read:在 post 请求有数据,但在begin事件中没有处理,则会调用read,如果read没有读取数据,在会触发Error回调,关闭socket
End:当socket超时,并且response被关闭时也会调用;server被关闭时调用
Error:除了socket超时不会关闭socket,其他都会关闭socket
End和Error时间触发时应关闭当前comet会话,即调用CometEvent的close方法 Note:在事件触发时要做好线程安全的操作
首先,Servlet 接收到请求之后,request 数据解析;
接着,调用业务接口的某些方法,以完成业务处理;
最后,根据处理的结果提交响应,Servlet 线程结束。
客户端发送一个请求
Servlet 容器分配一个线程来处理容器中的一个 Servlet
Servlet 调用 request.startAsync(),保存 AsyncContext,然后返回
任何方式存在的容器线程都将退出,但是 response 仍然保持开放
业务线程使用保存的 AsyncContext 来完成响应(线程池)
客户端收到响应
onStartAsync:Request 调用 startAsync 方法时触发
onComplete:syncContext 调用 complete 方法时触发
onError:处理请求的过程出现异常时触发
onTimeout:socket 超时触发
推荐阅读
关于程序员大白
程序员大白是一群哈工大,东北大学,西湖大学和上海交通大学的硕士博士运营维护的号,大家乐于分享高质量文章,喜欢总结知识,欢迎关注[程序员大白],大家一起学习进步!