varnish作为缓存服务提供者,本身没有内容,所有内容都是从后端的服务器或其它缓存服务器上取过来的。当varnish收到这些内容之后,需要根椐一定的策略确定是否缓存它,如果需要缓存,还需要确定可以缓存的时间。
1、varnish缓存策略
缺省是根椐后端返回的http状态码决定是否缓存。可以缓存的状态码如下:
200
203 300 301 302 410 404 varnish现在还不支持ranges请求,所以不会缓存206状态的结果。管理员可以在vcl的配置文件中的vcl_fetch部分,加入自已的缓存策略,方法是修改beresp.cacheable变量。下面的例子,看后端返回中如果设置了cookie,则不缓存:sub fetch { if (beresp.http.Set-Cookie) { set beresp.cacheable = false; }}
2、缓存时间的计算方法
缺省的缓存时间计算方法如下:
先根椐max-age确定缓存时间看返回头中的Cache-Control头中,有没有指定s-maxage或max-age信息,另外,如果后端是一个缓存服务器,它还会指定一个age头,表明已经缓存过的时间,这样需要减去age头指定的时间,计算出对应的缓存时间。例1 只有max-age,没有ageCacheControl: max-age=86400缓存时间:86400秒,即一天例2 同时有max-age和age信息CacheControl: max-age=86400Age: 6400缓存时间:86400 - 6400 = 80000秒. 如果没有max-age信息,则根椐Expires头部计算缓存时间先看有没有Date头, 如果没有Date头 看expires指定的时间是否小于收到数据的时间 小于,表明从后端取得内容已经过期,缓存时间为0,不缓存 >=,则缓存到Expires指定的时刻再过期 如果有Date头 看Expires指定的时间是否小于Date指定的时间 小于,取到已经过期的内容,缓存时间为0,不缓存 >=,则看Date时间跟取到内容的时间差别(判断本机和后端的时钟差异) 小于clock_skew(缺省是10秒,管理员可以设置别的数值),以本机时间为准 看Expires指定的时间是否小于收到数据的时间 小于,表明从后端取得的内容已经过期,缓存时间为0,不缓存 >=,则缓存到Expires指定的时刻再过期 >= clock_skew,以后端的时间为准 缓存时间为Expires - Date的差值. 如果既没有max-age信息,又没有指定Expires过期信息则按default_ttl(缺省是2分钟,管理员可以设置成别的数值)设置缓存时间。管理员可以在vcl的配置文件中的vcl_fetch部分,手工指定缓存时间,方法是修改beresp.ttl变量。下面的例子,将缓存时间设置成20分钟(1200秒):set beresp.ttl = 1200s;3、给用户返回已经过期的对象
varnish内部有一个grace模式。当后端不可用,或者已经向后端发过更新请求的情况下,别的客户再请求这个对象时,会收到已经过期的版本,当然过期的时间在可接受的范围内。
varnish缺省可接受的过期时间范围是不超过10秒,可以修改params中的default_grace参数。修改这一数值,但这样的改法相当于改了全局的参数,适应于所有请求。如果想只修改特定的url对应的对象的grace时间范围,则需要修改vcl配置,改两个地方。首先需要修改vcl_recv过程,在收到用户请求时指定可以接受过期对象的过期时间范围。其次需要修改vcl_fetch过程,从后端取到内容时,设置对象过期后还可以保留的时间,这样以便在过期后不会立即被后台线程清理掉。下面的例子针对特定的请求,将接受对象的grace时间设置为2分钟。sub vcl_recv { set req.grace = 2m; } sub vcl_fetch { set beresp.grace = 2m; }
4、varnish对象过期之后的更新说明
对象过期之后,过了grace时间,就会被后台线程清理掉。下一次用户再去访问的时候,会从后端重新抓取该对象。更合适的方法是发一个ims请求,如果后端对应的对象没有更新就不抓。这一点squid处理得比varnish好。希望以后的版本能改进这一块。
参考信息:/bin/varnishd/cache_center.c的cnt_fetch函数/bin/varnishd/rfc2616.c的RFC2616_Ttl函数/bin/varnishd/cache_hash.c的HSH_Lookup函数