工具站点地址: https://data.v2ex.pro/
仓库地址: https://github.com/HelloWorldImJoe/v2ex-info-history
数据源地址: https://github.com/GrabCoffee/v2ex-info-newsletter-data
技术栈:
纯React前端项目
数据采集:
使用Cloud Flare定时采集的数据, 然后保存到了github仓库中, 有些时候可能会被限流导致一些采集不到的脏数据, 在前端做了一层过滤,应该不影响整体的分析.
发布:
这个可以详细说一下思路
-
使用了Planet的文件夹发布功能: 将项目打包之后, 通过planet发布文件夹并生成ipns
-
在V2EX的Planet管理器中, 提交这个ipns, 并绑定了data.v2ex.pro的域名
-
因为正常V2ex的Planet管理器是会去站点找一个planet.json的文件, 所以我伪造了这个文件, 并修改了这个文件对应的ipns, 目的是能够让v2ex抓取到我最新的cid来与上面提到的域名做关联. 为了在Planet管理器中能显示头像, 我还加了一个avator的头像, 看起来像是一个正常的站点,

-
整体就是这么一个思路,大家可以尝试一下, 很好玩. 还可以通过这个planet.json做一些更好玩的事情
预览图:


ps: 数据不是实时的, 最新的数据是昨天(utc时间)的, 如果是早晨8点左右的话, 可以算是伪实时😂