有没有现成的工具能够完整抓取微信公众号内容-含图片
国内版权保护很差,所以网站都专门设计这种延迟就是为了防止爬虫和搜索引擎。
Chrome上有一可以将网页保存成PNG或PDF文件的插件,保存的内容就是浏览器里显示的网页内容。
https://www.printfriendly.com/extensions/chrome
https://chrome.google.com/webstore/detail/take-webpage-screenshots/mcbpblocgmgfnpjjppndjkmgjaogfceg
1,自己浏览时可以用userscript预加载图片
setTimeout(function(){
document.querySelectorAll("img.img_loading").forEach(i=>{
i.classList.remove("rich_pages");
i.src = i.dataset.src;
})
}, 500);
2,archive.md支持公众号图片,但这站背景存疑
3,本地备份可用SingleFile
以上都是针对个人的,我没有类似ArchiveTeleBot的自动化需求
@chinatimeline #1 这项技术是用来提高页面加载速度和节省流量的,反爬一般不在这上面做文章。
使用 https://github.com/Y2Z/monolith 完美解决,可以保存微信图片。
效果如下
http://206.189.252.32:8083/
@小二 #5 感謝。不過我以前一直都是用在某個論壇上分享的工具小軟件保存微信文章的。
https://i.ijrou.com/p/story/WeChatDownload.html
它會生成一個文件夾存所有圖片,還有一個本地html。希望對您可能有用。