找回密码
 快速注册
搜索
查看: 127|回复: 7

[Wayback Machine] 保存帖子失败

[复制链接]

3147

主题

8381

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65357
QQ

显示全部楼层

hbghlyj 发表于 2022-8-5 03:05 |阅读模式
我用Save page尝试保存帖子
https://kuing.cjhb.site/forum.php?mod=viewthread&tid=9408
但是爬虫没有保存任何有效信息:
先是被重定向到了
https://kuing.cjhb.site/forum.php?mod=viewthread&tid=9408&i=1
然后被重定向到了
https://kuing.cjhb.site/forum.php?mod=viewthread&tid=9408&i=2
然后被重定向到了
https://kuing.cjhb.site/forum.php?mod=viewthread&tid=9408&i=3
最终跳转到了
https://support.google.com/accounts/answer/61416
并且有错误信息:
Loading...

https://www.google.com/cookies.html |
            12:51:39 August 03, 2022

Got an HTTP 301 response at crawl time

Redirecting to...

https://support.google.com/accounts/answer/61416

3147

主题

8381

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65357
QQ

显示全部楼层

 楼主| hbghlyj 发表于 2022-8-5 03:09
reqbin.com测试一下:
  1. curl https://kuing.cjhb.site/forum.php?mod=viewthread&tid=9408
复制代码
结果:
<html>

<body>
    <script type="text/javascript" src="/aes.js"></script>
    <script>
        function toNumbers(d) {
            var e = [];
            d.replace(/(..)/g, function(d) {
                e.push(parseInt(d, 16))
            });
            return e
        }

        function toHex() {
            for (var d = [], d = 1 == arguments.length && arguments[0].constructor == Array ? arguments[0] : arguments, e = "", f = 0; f < d.length; f++) e += (16 > d[f] ? "0" : "") + d[f].toString(16);
            return e.toLowerCase()
        }
        var a = toNumbers("f655ba9d09a112d4968c63579db590b4"),
            b = toNumbers("98344c2eee86c3994890592585b49f80"),
            c = toNumbers("8c914bdda024e3ac8096d2cdeea3ec90");
        document.cookie = "__test=" + toHex(slowAES.decrypt(c, 2, a, b)) + "; expires=Thu, 31-Dec-37 23:55:55 GMT; path=/";
        location.href = "https://kuing.cjhb.site/forum.php?mod=viewthread&tid=9408&i=1";
    </script><noscript>This site requires Javascript to work, please enable Javascript in your browser or use a browser with Javascript support</noscript></body>

</html>

3147

主题

8381

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65357
QQ

显示全部楼层

 楼主| hbghlyj 发表于 2022-8-10 15:08
forum.infinityfree.net/t/javascript-requires/9957
That will be the reason for my leaving the infinityfree :neutral:

infinityfree.net/support/javascript-error-using-api-or-mobile-android-app/
Can I disable this security system?

No, this security system is mandatory on all websites and cannot be disabled.

If this security system means your website or application does not work as expected on InfinityFree, please consider to moving your website to premium hosting. On premium hosting, this security system is not present (your website will be protected in less obtrusive ways), so you can access your website through other clients which are not browsers (like mobile apps, automated verification tools, etc.).

3147

主题

8381

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65357
QQ

显示全部楼层

 楼主| hbghlyj 发表于 2022-8-12 02:13
2022.08.11更新:
archive.ph/可以成功存档
d01373f082025aaf4bb6be36f7edab64024f1a43.png

3147

主题

8381

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65357
QQ

显示全部楼层

 楼主| hbghlyj 发表于 2022-8-12 12:32
本帖最后由 hbghlyj 于 2024-10-22 17:42 编辑
Saved pages will have no active elements and no scripts, ...

archive.ph只保存JS初始化后的页面的元素, 不保存JS. 对于MathJax来说, 只会保存MathJax初始化后的SVG, 而MathJax上下文菜单无法使用.


它也不能正确保存 PDF!它只保存 PDF 第一屏的截图!例如,查看此网页

3147

主题

8381

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65357
QQ

显示全部楼层

 楼主| hbghlyj 发表于 2024-10-23 01:05
hbghlyj 发表于 2022-8-11 18:13
2022.08.11更新:
用https://archive.ph/可以成功存档

由于archive.org服务现在不可用,我们只能使用archive.ph

3147

主题

8381

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65357
QQ

显示全部楼层

 楼主| hbghlyj 发表于 2024-11-5 01:34
hbghlyj 发表于 2024-10-22 17:05
由于archive.org服务现在不可用,
已恢复!!

3147

主题

8381

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65357
QQ

显示全部楼层

 楼主| hbghlyj 发表于 2024-11-8 02:42


gizmodo.com/the-internet-archive-returns-just-in-the-nick-of-time-2000520626
在网站因网络攻击瘫痪近一个月后,互联网档案馆周一宣布已恢复其最有价值的服务之一——“Save page now”功能,该功能允许用户将网页副本添加到该组织的数字图书馆。

一个自称 SN_BLACKMETA 的黑客组织声称对 10 月 8 日的攻击进行了部分攻击,其中包括一次分布式拒绝服务 (DDoS) 攻击,导致互联网档案馆的网站无法使用。

在最近的攻击之后,SN_BLACKMETA 声称他们之所以针对互联网档案馆,是因为它“属于美国,众所周知,这个可怕而虚伪的政府支持恐怖主义国家‘以色列’正在进行的种族灭绝。”

互联网档案馆成立于 1996 年,是一家总部位于旧金山的非营利组织,提供对历史网页、数字书籍以及通过其网站上传的各种其他媒体的访问。

手机版|悠闲数学娱乐论坛(第3版)

GMT+8, 2025-3-4 19:30

Powered by Discuz!

× 快速回复 返回顶部 返回列表