如果您登录到archive.org和将网页存档,则有一个选项Save:

我查看了选中此复选框的一个请求中的所有http标头,并检查了一个没有此复选框的请求,找不到与此复选框对应的两个请求之间的任何差异。
我想使用wget或类似和/或Java来模拟这个复选框。我该怎么做?
奖金指的是任何人谁能解释如何使用网页检查器,一个扩展或类似的方法来解决这个问题。
发布于 2020-08-13 12:48:30
但两者有区别。“用和不做请求”复选框,右键单击它们,选择Save all as HAR with content。别说了。(在DevTools中也可以看到--在“Header”选项卡的底部)。
用capture_outlinks=on
"postData":{ "mimeType":“application/x form-urlencoded”,"text":postData "params":{ "name":"url",“mimeType”:"https%3A%2F%2Fstackoverflow.com%2F“},{ "name":"capture_outlinks",“值”:"on“}
没有:
"postData":{ "mimeType":“application/x form-urlencoded”,"text":"url=https%3A%2F%2Fstackoverflow.com%2F","params":{ "name":"url","value":"https%3A%2F%2Fstackoverflow.com%2F“}
https://web.archive.org/save/status/{job_id}?_t={timestamp}的东西的后续GET请求。响应它,您会发现application/json中包含outlinks数组的JSON,实际上,在这两个HAR中都存在outlinks数组。但是当capture_outlinks=on也有resources数组时。save/status或在“启动器”选项卡中的DevTools中找到。job_id就是它,您可以通过在同一个JSON中搜索它的值来确认它,还可以在对watchJob()的调用中对初始POST到https://web.archive.org/save/https://stackoverflow.com/的响应中找到它。也许我错过了什么,但我现在看到了,你需要
url=https%3A%2F%2Fstackoverflow.com%2F&capture_outlinks=on发送一个帖子job_id (可能是regexp)job_id,向https://web.archive.org/save/status/{job_id}?_t={timestamp}发出GET请求(当然,您需要cookies,并可能生成正确的时间戳)https://stackoverflow.com/questions/63315159
复制相似问题