自动化获取公众号文章?太难了

2020-10-13 · 周二一般中雨

今天主要研究了一下公众号开发,想看看有没有什么法子能获取公众号里的文章,想实现后端某功能的自动化获取。最终发现有接口(batchget_material)可以获取公众号的图文素材,但包含了未发布的内容,也没字段可以用于区分。该接口的调用也挺麻烦的,首先需要先获取一个 AppSecret,之后通过 Secret 获取 access_token,才可以访问该接口。对了,这个 Token 还是 2 小时有效时间的喔!是不是很惊喜?

继续看了一下文档,貌似没有其他接口可以直接获取已推送内容以及其访问链接,非常尴尬。😅 我便想到了爬虫法,有没有什么页面可以直接抓取?直接拿公众号那里的开刀,发现在浏览器上无法直接打开,提示“请使用微信客户端打开”。我试了下修改 Header 和 UA,均无效果。

上外网搜了一下,看到一个开源项目的解决方法也是抓取。但是他抓取的并不是微信的网页,而是“搜狗微信搜索”的结果。还有一种办法是利用微信的 AJAX 接口,但是这种方式需要登录。这种东西谁知道什么时候会不会因为机器人“违规使用”导致封号呢?

如果使用素材接口的方式,那个 URL 不知道是否算作“内部预览链接”,会不会和推文里的链接存在差异?要是用那个爬虫,感觉时效性也不靠谱。最终权衡了一下,还是选择放弃了。不得不说微信这块的设定真的很烂,你不允许我抓取别人的公众号,那我抓我自己的总可以吧!你说是不是?

あの星の向こうに

あの星の向こうに

高柳知葉
Paul

Paul

特立独行的一只前端菜狗。这篇日记编写大概耗时了 0 分钟,内容均为个人原创,并采用 CC BY-NC-SA 4.0 授权协议,转载请注明来源,谢谢!如本站内容对你有所帮助的话,不妨 捐助支持 一下?

近期评论

鲍小螺: 前辈多多指教!ahu: 后生可畏寻梦xunm: 真不错,板子很好看。timochan: 太惨了( ,更新暴毙,如果恢复没成功,数据也 dump 不出来鲍小螺: 在这部分对话中,广树和保罗继续讨论生活的不同方面。保罗提到了技术更新和国内的优秀 IT 技术。广树解释了在国内积累的经验如何在日本产生穿越的感觉,并表达了对于日本生活节奏的喜爱。他还提到了医疗水平的差异和对于生活方式的感受。保罗表示,通过动漫和现实的对比,艺术来源于现实,日本生活的确有着独特之处。他们讨论了国内的生活节奏和就医等方面的压力,以及个人选择的自由。最后,他们也谈到了不结婚不买房的选择和对于房价的困扰。鲍小螺: 该对话进一步讨论了房地产和税收的问题。保罗提到了国内的房地产税和增值税以及日本的固定资产税。广树解释了日本房地产税的收取方式,以及房产税对于国内房产的影响。他认为,与国内相比,日本的房子质量和服务更好。保罗提出疑问,为什么自己拥有的地也要交税。广树解释了类似增值税的原理,并指出在日本拥有房产是稳定安全的。最后,保罗表示从广树的角度来看,情况确实是如此。鲍小螺: 这篇文章的聊天记录也尝试过用 GPT 总结,结果并不是太好,不知道是不是 Prompt 的问题,实际出来的内容过于简练了,于是又耗费了半小时写完,呼~
奇趣音乐盒技术源于 Kico Player
Emmm,这里是歌词君