深入剖析nginx时间缓存

本文适合对nginx实现原理比较感兴趣的同学阅读,需要具备一定的服务端编程知识。

一、背景

在服务器开发领域,时间的准确度关系到系统能否正常运行,尤其是当系统中存在超时事件需要处理时。但是系统时间的获取需要一次昂贵的系统调用,作为一款成熟的服务器软件,Nginx是如何优化这部分的性能开销?

二、时间缓存

接触过系统设计的同学都知道,对于频繁的数据获取,在数据未变化的情形下,可以通过增加缓存来优化性能,因为缓存的访问速度远高于源数据的访问速度。这样的例子有很多,比如CPU设计有二级缓存,在传统的database基础上有了我们今天的redis、memcache等nosql。对于系统时间也一样,既然获取系统时间开销较大,可以尝试着将获取到的时间缓存起来,需要时直接从缓存中取就可以了。但与此同时,也引入了缓存时间与实际时间不一致的可能,下面看看Nginx是如何解决这一问题。

三、设计与实现

Nginx时间缓存设计

深入剖析nginx时间缓存

如上图所示,Nginx时间缓存包括时间读取和时间写入者,当需要更新时间时,nginx调用gettimeofday系统调用获取时间,然后更新缓存。需要获取时间的代码直接从time cache中取出即可。

这里又产生了新的问题,具体包括:

  • 读写并发,即读和写同时操作时间缓存会造成获取的时间混乱。

  • 多写并发,多个执行体同时更新时间缓存,同样造成时间混乱。

而常见的解决互斥的方案包括:

  • 加锁保证数据串行化

  • 无锁化设计

像Nginx这样对于性能有着极致追求的server来说,自然不会使用系统自带的锁机制。其实现的ngx_lock和ngx_unlock的背后都是无锁化的原子操作。

  1. 对于多写并发,nginx在ngx_time_update函数中通过全局的ngx_time_lock进行互斥,确保同一时刻只会存在一个执行体更新时间缓存。

  2. 对于读写并发,nginx设计了NGX_TIME_SLOTS个slot,用于隔离读写操作的时间缓存。同时引入时间缓存指针,原子地更新当前缓存的指向位置。

Nginx时间缓存实现

下面看具体实现代码(以nginx-1.13.1为例src/core/ngx_times.c):

void ngx_time_update(void)

ngx_time_update的流程图为:

深入剖析nginx时间缓存

值得一提的是,这里采用了ngx_memory_barrier来避免指令重排,这样可以尽可能地保证ngx_cached_time、ngx_cached_http_time.data、ngx_cached_err_log_time.data、ngx_cached_http_log_time.data、ngx_cached_http_log_iso8601.data、ngx_cached_syslog_time.data中存储的时间数据一致。

slot设计

上面谈到了nginx采用slot来从空间上避免读写执行体同时操作时间缓存,slot的设计规则为:

深入剖析nginx时间缓存

  • 获取时间的执行体采用ngx_timeofday获取了当前ngx_cached_time的快照,随后读取对应的slot中数据,包括sec和msec。

  • 更新时间的执行体通过ngx_time_update原子更新ngx_cached_time指向,这样更新之后的时间读取就是新的slot中的时间数据。

这里,nginx利用了修改指针的原子性,确保读写不会造成时间数据混乱。而时间数据本身包括sec和msec,无法完成修改的原子性,这种将非原子性修改操作转换为原子性修改操作的手法,值得借鉴。

原PO主:亘井/软件编程之路

评论

目前评论:0   

点击加载更多评