【实时性迷思】CPU究竟跑的有多快?

共 2484字,需浏览 5分钟

 ·

2021-03-26 18:26


【说在前面的话】


相对人的感官来说CPU跑的太快了——即便是人们常常用来描述时间短暂的“一眨眼功夫”对CPU来说也是及其“漫长”的好几百毫秒了——仔细想想有几个人能在一秒钟内连续眨十次眼睛呢?正因为如此,即便是超级循环里面顺次执行的多个任务,在人类看来也往往是“一瞬间就执行完了”。那么CPU究竟跑的有多快呢?是很快、非常快还是快得不得了?如果我们继续站在人类的视角考虑这个问题,其抽象程度无异于思考“无穷大究竟是多大”。

让我们想象着周围的时间相对你突然都慢了下来,从微处理器的视角重新审视这个世界。


【第一个参考点】



1MHz就是 1us


“1MHz就是1us”是一个基准概念,通过修改思考方式,我们就可以利用它快速而有效的解决很多实际问题。作为练习,我们来尝试依次快速的回答以下几个问题:

 

假设每个时钟脉冲都对应一个指令周期:

 

  • 已知系统频率是1MHz,请问1us内有几个指令周期?

  • 已知系统频率是12MHz,请问1us内有几个指令周期?

  • 已知系统频率是11.3728MHz,请问1us内有几个指令周期?

  • 已知系统频率是500KHz,请问1us内有几个指令周期?


很显然,如果你试图首先计算出系统周期:

再用1us去相除:

这个过程已经慢了


让我们来换一种思维模式,既然1MHz对应1us(也就是1us对应一个指令周期),那么12MHz就是1MHz的12倍,1us时间内就有12个指令周期;同理可得,当系统频率分别是11.3728MHz和500KHz(0.5MHz)的时候,1us时间内对应的指令周期数分别是11.3728个和0.5个。

借助这个等效,我们就可以对CPU的处理能力建立更多量化的感官,比如1ms的时间内,CPU能做多少事情呢?由于1ms等于1000us,对1MHz的系统来说,1ms可以完成1000个指令周期,12MHz的系统可以完成12000个指令周期。然而1000和12000这样的数字对于只有十个手指的人类大脑来说还是太抽象了,因此我们更进一步,把指令周期换算成等效的代码尺寸:


  • 由于主流的微控制器其指令集中大多是单周期指令,我们不妨假设所有指令都是单指令周期的,这样1个指令周期就对应一条指令;

  • 假设每条指令都是2个字节大小(16位指令);

 

这样,1ms时间内1MHz的系统可以运行大约2KB的代码,一个12MHz的系统可以运行24KB的代码,依次类推。


那么2KB是什么概念呢?如果你平时有留意编译后的代码尺寸,2KB大约是一个基础驱动库的尺寸,可以包含一个USART的驱动或者实现电源管理;而24KB几乎是一个小型工程应用的尺寸了


借助这些非常具体的数字,我们很容易拿它们和中断处理程序进行比较,建立直观的认识——比如:
  • 中断处理程序“执行的是不是足够快”?

  • “丢中断的风险究竟有多大”等等?

  • 使用中断接收外设数据的时候会不会发生丢失?


可以肯定的是,这种忽略循环和条件分支的评估方法几乎是一个代码的最差情况,也就是说,在1MHz的系统中对于一个1KHz的毫秒中断,中断处理程序越接近2KB,就说明系统越可能“丢中断”


在这种情况下,除非你通过编译器提供的等效汇编代码仔细的计算过实际的周期数,或者是通过perf_counter这样的工具实际测量过代码的周期消耗——确信时间上处理周期不会大于1ms且这期间不会存在其它中断处理程序,否则你的中断处理程序还是比2KB越小越好。



【一个真实的案例】


在一个72MHz的Cortex-M3/M4系统下,使用中断模式来接收串口数据,波特率为115200的情况下:

  • 最大允许屏蔽中断多长时间?

  • 中断处理程序允许的理论最大安全尺寸是多少?


首先,我们要搞清楚系统的指令大小和指令集的周期数情况。以ARM Cortex M3/M4为例,其指令大部分为单周期指令,支持16位指令和32位指令。为了评估中断处理程序的尺寸上线,我们可以分别以16位指令和32位指令为基础计算出两个结果作为参考范围;


其次,系统频率为72MHz,假设USART没有硬件FIFO,则115200的波特率在典型的“1起始位+1终止位+无校验位+8数据位”的配置下(每个数据帧对应10个bit),实际上对应最大11.52KB/s的数据率——或者说,USART完成中断每秒钟发生 11.52K次。至此,我们可以回答第一个问题,即在这一系统中最大允许屏蔽中断多长时间——1/11.52KHz ≈87us。


也就是说,假设中断屏蔽的时间为87us则中断处理程序的理论最大尺寸范围是(72 * 87 * 2)字节到(72 * 87 * 4)字节,即12.528KB到25.056KB之间。取最小值12KB。


结论,中断处理程序及其调用的子函数,其尺寸总和至少要小于12KB才能确保115200波特率的接收完成中断得到及时的响应。由于未考虑循环、分支以及其它任务的存在,以上结果仅用于粗略的快速评估,实际代码通常应该远小于这一上线值。当实际尺寸接近或者超过13KB时基本可以判定该系统存在无法及时稳定的响应中断的可能——需要对代码进行进一步的具体分析。

 

(我的天哪!接收1个字节的空隙,居然可以运行13KB代码!!!)


【结语】



“1MHz就是1us”的等效为我们提供了一个基准,建立了关于“CPU跑多快”最直观的感受,同时也为评估代码尺寸、系统可靠性提供了有力的参考。掌握了这个基准,作为一个合格的程序员,不应该仅凭人类的感觉毫无依据评价CPU的处理能力了,“72MHz足够快了吧?”“我已经用了芯片的最高频率”这种话再也不能轻易说了,我们应该定量而不是定性的去看待这类问题



原创不易,

如果你喜欢我的思维、觉得我的文章对你有所启发,

请务必 “点赞、收藏、转发” 三连,这对我很重要!谢谢!


欢迎订阅 裸机思维


浏览 52
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报