只要用到正则, 整页 html 文档用正则表达式来匹配 URL 效率还是很低, 而且还不如 HTMLRewriter 好用.
之前以为是 HTMLRewriter 针对每个 element 都去调用一遍 .element() method 去匹配和转换是性能瓶颈的原因, 这里发现对整页文档去 .replace() 好像并没有提升什么效率, 每页上百个链接, 每个链接都使用好几次正则, 难怪性能那么差 (
之前以为是 HTMLRewriter 针对每个 element 都去调用一遍 .element() method 去匹配和转换是性能瓶颈的原因, 这里发现对整页文档去 .replace() 好像并没有提升什么效率, 每页上百个链接, 每个链接都使用好几次正则, 难怪性能那么差 (