2020年4月可用的,火车头采集微信公众号最近文章(包括实时更新)的方法及思路
这几天一直没啥时间,原因在于小白去研究火车头采集微信公众号的最新文章去了。结果远比想象中要难。但是也还好,折腾了三天左右搞定了。
先说说我的需求:
抓取一批公众号,大概10个。监控最新发文,粗略想法是上午检测一遍,下午检测一遍。有新文章就采集下来。
为什么用火车头?
这软件很好用,有自动网址去重功能。重复的链接跳过不再采。而且这火车头有wordpress免登录发文接口,小白我一直在用,习惯了,方便上手。
解决方案选定:
主要集中解决公众号历