存档机器人

By Colinchao at 2019-05-25

@Ciao Archive2049Bot挺好用的。

除了archive.is,您可否为Wayback Machine (https://web.archive.org )开发一个存档机器人?

机器人


「Internet Archive 抓取网页时遵循 Robots 协议 ,如果网站在 robots.txt 中声明禁止搜索引擎抓取,那么 Internet Archive 将拒绝存档该网站。所以对于微信公众号,无法用 Internet Archive 进行存档的。」 这篇介绍了这两种存档。https://blog.bgme.me/posts/how-to-archive-a-web-page/

无名 at 2019-05-25
1

理论上可以选各种存档工具,包括你说的wayback,只需要修改 https://github.com/Terminus2049/ArchiveTeleBot/blob/d6de38f0f068c4897093bece2abf3f222e7b2235/ArchiveTeleBot.py#L16 后面的参数就行,把is改为ia就可以了。如果选择参数all,就会返回所有可能的存档机器人。

你可以看文档:

https://github.com/oduwsdl/archivenow

小二 at 2019-05-25
2

@小二 #2 我既不是程序员,也没有VPS,恐怕本人无能为力。

Colinchao at 2020-04-29
3

WTF? 站长,你改了名字后就有人抢注了你之前的名字。抢名字很有趣吗🤷🏻‍♂️……

Colinchao at 2020-04-29
4