为什么大型网站前端使用PHP,后台逻辑却用Java?
来自:知乎
链接:https://www.zhihu.com/question/20314377
前两周参加完 ThinkInLamp 的 PHP 架构师大会,听鸟哥一上午的分享,感慨很多,PHP 业界虽然方向不明荒废了两三年的时间,终究还是又重新崛起了。
其实包括 Java 的重启问题,现在也已经很多解决方案了,再不济,双进程 Load Balance 切换也很容易做(但可能引发冷启动问题)。
而 PHP 的性能问题随着 @Laruence 在 PHPNG 上的努力,眼看着 JIT 快来了,ZVAL 也优化了,尤其是做数据分析最坑的 Array 常量引用和 Array 结构大小等问题都得到了解决,必然在未来有着更广阔的空间。现在也有了类似 @韩天峰 的 Swoole 这样的解决方案,真正做到了 fastcgi.com 所提出的那套标准 FastCGI 方案,消除了每次启动重建上下文、初始化数据的成本,并且还能以 Backend / Web Server / TCP or UDP Server 等多种方式工作。
但这些,并没有让异构语言环境消亡,反而在业界越来越多见了。核心关键点还是在于开源业界的兴起使得我们有更多更好的选择,而且架构的发展也越来越容易、越来越有必要以异步交互等方式解耦。非核心模块或中间件选用异构语言的开源项目,用到超出其性能上限或有特殊业务诉求涉入开发提升也是挺常见的事情。
而分层分模块之后,不同模块根据自己的业务场景、需求用不同语言实现已经越来越常见,当然也有一部分原因是公司技术团队的成分。而 PHP 和 Java 作为 Web 开发当中市占率最高的两项,在组合里常常一起出现也就不足为奇了。今天 Python / NodeJS / Go 等也已经有很多开源项目加入到异构系统的大军里来了。
// 原答案,大概是2012年左右写的吧。
首先,为什么是PHP和Java,不是其他。这和两者的开源社区都很活跃,并且都很适合进行Web开发有很大的关系,而且都很适合Linux环境下运行,可以在运维上统一管理。
尽管.Net市场占有率也不低,但由于Windows和SQL Server的License费用、开源社区不活跃等多种问题相对而言考虑得少一些。TIOBE TOP 10中适合Web开发的语种还包括了Python Perl Ruby,其中Perl已经是昨日黄花,主要在服务器脚本领域还有较多应用,Web上已经不太可能Yesterday oncemore了。Python最近上升势头挺猛,但仅需要考虑文档较少、招聘相对困难基本就注定了暂时不会是大网站的主流选择。Ruby就不更不用提了。
再看一下两个语言之间的差异。PHP灵活,上手快,易修改,发布快捷,缺点是容易犯错(常见如拼写错误、SQL注入、上传执行等)、执行效率不高、缺乏全局缓存。Java的优点则是稳定可靠、运行效率高(尤其是JIT的出现之后差距更大了)、不容易犯错(强类型、预编译、必须拦截异常等等),缺点是开发和发布的效率相对较低。尽管优秀的工程师能在一定程度上改变以上的问题,但通常而言,哪能到处都是高手多如狗的梦之队?
然后从MVC的层次结构上说,在一般网站项目的开发周期中,需求变更最频繁、调整最多的是View,其次是Controller,最后是Model。这非常好理解,没事干谁天天改数据结构?每次版本升级控制结构都要改的啦,或多或少而已。而View,啥时候两天不改BU啊PM啊UED啊大概是集体休年假了吧?
再次是两者之间的通信,目前RPC技术已经足够成熟,无论是Web Service/Hessian/RESTful API都能够让开发人员专注在功能开发上,而不需要过多的考虑异构平台的差异和通讯的细节。这也就意味着在大公司里同时应用两种语言的方案并不会引入过多的复杂度和工作量。当然,文档量的下限倒是因此被拔高了不少,但事实上大部分团队对此其实都是喜闻乐见的:别每天说文档重要但没空了,你不写其他同事怎么配合?
总的来说,靠近用户的前端,使用PHP能够更快的完成前端频繁而琐碎的更新,自如的应对各种需求的变化。页面的结构调整、用户输入内容的基本验证、仅只和用户交互有关的简单逻辑等都很适合使用PHP来开发,甚至可以通过类似Smarty等模板技术将其页面的变动迁移到前端团队。而基本的业务逻辑和数据的更新采用Java开发,可以有效的提高复用度、提升性能和吞吐能力、规避安全问题等。而开发效率稍有降低换来的是可维护性的提升,发布速度慢就更不是问题了,因为通常对于基础业务逻辑的调整往往都是整体修改,并层层测试确认才能发布的。
所以,大型网站前端采用PHP后端采用Java,既好招人又好维护、系统稳定还性能高、连安全性都大大增加。代码复用、文档完备度居然也都改善了。让你在以上这些好处触手可及时,对架构师知识谱系在广度上要求更高一些这事根本就不是个问题。
好吧,后面的同学补充了一个很好的问题,为什么不是仅用PHP或是仅用Java?这个我原本稍微提了,不过之前发布前删掉了的,因为问题是为什么PHP+Java。其实也有很多公司为了保证团队组织不至于过度复杂,会更倾向于采用单一语言,尤其是中小公司。
单一方案其实一样可以做良好的隔离,PHP同样可以提供Service,而性能问题其实很多时候是算法和架构的问题而不是语言差异的问题。如Velocity或JSTL等也是很优秀的隔离方案。
但我们都知道,现实往往比理想骨感很多,这些方案在高压力下会暴露出很多问题而体现双语言的优势,这些在上面其实都提到,详细说明一些很难得到改变的点:
1、PHP由于其动态脚本语言的特性,包括类、函数、常量在内都需要在每次请求周期中重复执行后才能建立运行环境;为了保证解析速度而牺牲编译质量;应用了FastCGI但仅仅只是复用进程处理请求减少fork成本而不是像其他语言,初始化完毕后通过FastCGI的接口获得数据并以对应接口返回数据等几个原因,基本上已经不可能在性能上追回当初更烂现在开着JIT牌跑车的Java了。更何况,还缺少了系统级共享数据的支持,使得核心数据一次性初始化后重复使用必须借助扩展或中间件。
2、在PHP里是如此的容易犯错而难以发现,即使你用实质上出自官方的Zend Studio,也无法改变一个事实:要保证你的程序高质量无大错,得要有充足的经验、足够的严谨、以及——负责任的QA。淘宝的黄裳就曾经拿IDE这事开过玩笑。而玩笑背后的那个原因“缺乏中间件”最近几年有不少的改善,主要是不少中间件的支持变得更广泛了从而让PHP得益,但发展的根源其实还是在C和Java社区。性能和易犯错则是语言特性造成的技术难点,也是用来换取灵活、快捷的必要代价,很难去指望有根本的改善。
3、Java的世界里也有JSTL、Velocity和Freemaker等,但和PHP灵活而强大的动态能力、丰富的函数和类库、轻松的学习成本、多到令人发指的文档相比,简直就是渣,就是渣啊!JSTL改完了要重启Context啊有木有?Velocity不关缓存也要重启啊有木有?Velocity开缓存性能低下啊有木有?即使这些都不管,调整下某个数据校验规则要改Action也要重启有木有?
好吧,吐槽结束。
实际工作中性能问题可以通过良好的架构解决,容易犯错的问题可以通过框架和规范以及全面的测试来解决,中间件选择少些但其实该有的都有了,Java的灵活性一样有不少可供考虑的解决方案,不说 OSGi 之类,就算是挫得要死的摘掉节点重启,完成后重新上节点的策略也都能凑效。
所以,大家会看到单一语言的技术团队也很多,这个问题的真正考虑还是更多在团队自身的特点、积累等等。用了双语言的,也知道自己为什么要用这些,不用的也清楚自己的路该怎么走。最后的最后说一句:如果你不知道自己为什么要用双语言方案的话,基本上你也就不需要考虑它了。
后端java最大的优势在于庞大的生态环境,你想解决的任何问题,java都有现成的方案,而且,相对其他语言来说,基于jvm的方案在运行效率和运维成本上平均来说是最佳的(这里不讨论说什么运维人员的能力之类的,只假设我们的运维都只具有一般的平均水平),所以,后端天然是倾向java的,无论前端用什么。
至于前端,最大的问题在于,一个网站的UI,变动相当频繁,传统的基于java的开发方案,jsp tag lib,freemaker, velocity。。。。你让前端怎么改,怎么调试?不经过专门学习他们怎么看得懂?而且,java的开发模式,动不动上来就是MVC,后端跟前端结合太紧密了,基本上前端很难自由的在ui层工作。反过来,基于PHP的前端方案,至少做前端的都能看得懂,都能调试得了,这就是巨大的生产力的解放了,讲后端java做成rest服务,前端所有的动态代码都可以交给前端工程师,对他们来讲,最舒服的动态网页方案,自然就是PHP,这个是历史沉淀决定了,谁也没法改变,无论你多么看不起PHP,包括我自己也是并不喜欢PHP,但是仍然要再强调一次,对前端工程师来说,最舒服最自在的动态网页方案,仍然是PHP!就如同上面很多人回答的,PHP就是快,快在哪儿?PM说要改什么,前端上手10分改好,30分钟后已经release了。把任务发给后端工程师?那慢慢等吧。。。
===============
下面跑点题,顺便给自己打个广告。
上面说过,传统的java的前端方案,上来就是MVC,模板引擎,一堆东西,这些玩意儿,做企业应用是很好的,做网站?的确好像很少听说哈。为什么?我抄一段别处的文字(不用考虑版权,这就是我自己写的)
在过去十年,基于Java的MVC框架如同雨后春笋一般层出不穷,但都不愿意面对或者解决的问题是,它对前端设计师极不友好,而且,开发效率及其低下,互联网企业鲜有基于Java,尤其是基于MVC来构建自己的网站,是有深刻的原因的:
1、对前端设计师极不友好。MVC模式下,可编程的模板语言成为非常重要的角色,而以视觉创造为主要工作的前端设计师,他们熟悉的是HTML和CSS,而嵌入模板文件的各类动态代码,对他们来说即使不是如同天书,也是及其让人及其困惑的,当然,他们必然要面对这些内容,因此,传统的PHP必然成为他们的最佳,因为,这个至少是比较容易让人理解的。
2。开发效率低下。互联网企业的开发通常是快速迭代的,并没有明确的需求一说,传统的PHP开发模式之所以受到青睐,就在于它易于变更,开发速度快,MVC模式的开发在这一点基本完败,因此,很少有互联网企业会基于Java来构建自己的前端页面,即使有,也通常是基于JSP的自有框架。
更进一步的,在过去将近10年的MVC历史中,我们其实一直都被下面的问题困扰着:
1、前端设计师和工程师一直在抱怨嵌入到页面的动态代码让他们很难对页面进行大规模的重构,而另一方面,后端开发人员也经常抱怨他们要花很大的精力才能修复前端对页面的重构带来的问题。
2、开发人员经常还会因为模板语言贫乏的功能而饱受折磨。一些特殊的复杂渲染逻辑经常需要富有经验的开发人员才能写出极具技巧性的代码来实现。而这样的代码,通常会成为谁也无法理解的魔术代码。
3、开发人员对MVC低下的开发效率极度不满,我们一直在渴望可以有一个更加高效的开发模式。
好了,题归正传,如果我们一定要用java来做前端,究竟有没有比上面列举的这些MVC,模板之类的更好的办法?答案是有的,那就是view first。由Lift(不知道的lift的请参看:Lift (web framework))最先提出并倡导的view first的理念,应该算是对网站开发模式的一个漂亮的总结,实际上,PHP的前端方案,本身就是暗合view first的理念的。通过view first的理念,避开了繁琐的MVC架构,同时,lift提供了一个纯html的模板引擎,使得前端工程师可以在完全不考虑后端实现的情况下独立工作,对前后端的协同工作效率,可以说是有着划时代的意义的。
哦,差点忘了我自己的广告了,lift大法虽然好,但还是基于scala的方案足以让一大波人打退堂鼓。本人在这里隆重提供基于java的view first解决方案:astamuse/asta4d · GitHub
asta4本身最初的目的就是提供一个lift的java移植版,当然,在后期开发中,逐渐还是有了一些不同的东西,但从整体上说,lift对前端最重要的两个特性,在asta4d是几乎原样移植过来的:
1、view first
2、css selector driving template engine
前端的纯html模板中不会嵌入任何后端的动态代码,前端工程师只需要跟html打交道,我们的前端和后端是分开两个部门的,常规的工作流程是:
1、任务书或者bug ticket下来,前端开branch,开始做或者改页面
2、如果是页面的bug对应,通常到这一步就已经结束了,如果是新功能,或者bug需要后端协作,那么ticket转给后端
3、后端拿到ticket,开工干活,完事,push。
4、release
注意,这个过程中,前端和后端几乎不会交流,因为他们不需要交流!前端通过html和css,以及js表达自己的想法,后端只负责一件事情,把前端需要的数据填上去,是的,就是填数据而已,所以只有后端看不懂前端的数据应该填在哪儿,或者应该填什么数据的时候,才会需要有限的交流。
我们的一个实际经验是,一次耗费了前端部门2个人月的UI完全重构工作,当前端工作完成后,后端部门只花了30分钟,就完成了所有需要修改的地方,是的,30分钟,在前端完成工作后30分钟,我们的重构分支就合并到主干准备release了。
========补充==============
我在这个回答里有更详细的说明
PHP做后端,也是很流行的,但是:这意味着其他东东的开发:NOSQL,SHELL这些都是很常见的。PHP的单进程,无线程模式先天决定了它的短板,所以你在做某些业务设计的时候,必须小心翼翼的注意到这些雷区。
类似的问题还有PHP好搭档MYSQL,所以PHP做server端,相对于JAVA来说,开发成本,BUG控制代价更大。
视频号更新了,快来围观
分享 GitHub 技术文章
关注回复:资源