我注意到一些浏览器(特别是Firefox和Opera)非常热衷于使用.css和.js文件的缓存副本,甚至在浏览器会话之间。当您更新其中一个文件时,这会导致一个问题,但用户的浏览器会继续使用缓存的副本。
当文件发生更改时,强迫用户浏览器重新加载文件的最优雅的方法是什么?
理想情况下,该解决方案不会强制浏览器在每次访问页面时重新加载文件。
我发现John Millikin和da5id的建议很有用。这有一个专门的术语:自动版本控制。
我在下面发布了一个新的答案,这是我最初的解决方案和约翰的建议的结合。
SCdF建议的另一个想法是将伪查询字符串附加到文件中。(一些自动使用时间戳作为伪查询字符串的Python代码是由pi..提交的)
然而,关于浏览器是否缓存带有查询字符串的文件还存在一些讨论。(请记住,我们希望浏览器缓存该文件并在以后的访问中使用它。我们只希望它在文件更改时再次获取该文件。)
下面是我基于Bash脚本的缓存破坏解决方案:
我假设在index.html文件中引用了CSS和JavaScript文件
在index.html中为.js和.css添加时间戳作为参数,如下所示(仅限一次)
用上面的时间戳创建一个timestamp.txt文件。
在对.css或.js文件进行任何更新后,只需运行下面的.sh脚本
带时间戳的.js和.css index.html示例条目:
<link rel="stylesheet" href="bla_bla.css?v=my_timestamp">
<script src="scripts/bla_bla.js?v=my_timestamp"></script>
文件timestamp.txt应该只包含相同的时间戳'my_timestamp'(稍后将被脚本搜索并替换)
最后这里是脚本(让我们称之为cache_buster.sh:D)
old_timestamp=$(cat timestamp.txt)
current_timestamp=$(date +%s)
sed -i -e "s/$old_timestamp/$current_timestamp/g" index.html
echo "$current_timestamp" >timestamp.txt
(Visual Studio Code用户)你可以把这个脚本放在一个钩子中,这样每次文件保存在你的工作空间时它都会被调用。
简单的客户端技术
一般来说,缓存是好的…所以有一些技术,取决于你是在开发网站时为自己解决问题,还是在生产环境中控制缓存。
一般访问者不会有相同的体验,当你在开发网站时。由于一般访问者访问站点的频率较低(可能每个月只有几次,除非您是谷歌或hi5 Networks),那么他们不太可能将您的文件保存在缓存中,这可能就足够了。
如果你想强制一个新版本进入浏览器,你可以在请求中添加一个查询字符串,并在你进行重大更改时增加版本号:
<script src="/myJavascript.js?version=4"></script>
这将确保每个人都获得新文件。它可以工作,因为浏览器会查看文件的URL,以确定缓存中是否有副本。如果您的服务器没有设置为对查询字符串执行任何操作,那么它将被忽略,但是对于浏览器来说,该名称将看起来像一个新文件。
另一方面,如果您正在开发一个网站,您不希望每次保存对开发版本的更改时都更改版本号。那太乏味了。
所以当你在开发你的网站时,一个很好的技巧是自动生成一个查询字符串参数:
<!-- Development version: -->
<script>document.write('<script src="/myJavascript.js?dev=' + Math.floor(Math.random() * 100) + '"\><\/script>');</script>
在请求中添加一个查询字符串是一个资源版本化的好方法,但对于一个简单的网站来说,这可能是不必要的。记住,缓存是一件好事。
It's also worth noting that the browser isn't necessarily stingy about keeping files in cache. Browsers have policies for this sort of thing, and they are usually playing by the rules laid down in the HTTP specification. When a browser makes a request to a server, part of the response is an Expires header... a date which tells the browser how long it should be kept in cache. The next time the browser comes across a request for the same file, it sees that it has a copy in cache and looks to the Expires date to decide whether it should be used.
信不信由你,实际上是你的服务器使浏览器缓存如此持久。您可以调整服务器设置并更改Expires报头,但我上面写的小技巧可能是一种更简单的方法。由于缓存很好,所以您通常希望将日期设置为遥远的将来(“far -future Expires Header”),并使用上面描述的技术强制更改。
如果你想了解更多关于HTTP的信息或者这些请求是如何发出的,一本很好的书是Steve Souders的《高性能网站》。这是对这门学科很好的介绍。
这里的许多答案主张向URL添加时间戳。除非直接修改生产文件,否则文件的时间戳不太可能反映文件更改的时间。在大多数情况下,这将导致URL比文件本身更频繁地更改。这就是为什么你应该使用文件内容的快速散列,如levik和其他人建议的MD5。
请记住,该值应该在构建或运行时计算一次,而不是在每次请求文件时计算一次。
例如,下面是一个简单的bash脚本,它从标准输入读取文件名列表,并将包含散列的JSON文件写入标准输出:
#!/bin/bash
# Create a JSON map from filenames to MD5 hashes
# Run as hashes.sh < inputfile.list > outputfile.json
echo "{"
delim=""
while read l; do
echo "$delim\"$l\": \"`md5 -q $l`\""
delim=","
done
echo "}"
然后,该文件可以在服务器启动时加载并引用,而不是读取文件系统。