首页 > 抖音热点分享 > 抖音小视频采集你爱的小姐姐信息都在这里!
2021
10-31

抖音小视频采集你爱的小姐姐信息都在这里!

  最近抖音有点火,自从内涵段子被永久封停过后,抖音似乎就进入了一个高速腾飞期。

  既然抖音短视频热度这么高,今天我们就来看看俘虏了众多小哥哥小姐姐的抖音是如何进行数据采集的吧!

  普通情况下,我们使用爬虫采集网络信息的时候是基于其网站的前端代码,也就是你在任意位置鼠标右键—查看网页源代码看到的那些。

  抖音的视频都在APP上,我们没法查看他的源代码。好在抖音可以分享到微信然后使用浏览器打开查看。分享后的网址为:

  有趣的是,本来其他人不可见的视频播放数据,前端代码中也做了展示。包括作者,

  视频详情,视频封面,视频地址,视频宽度,视频高度,视频ID,作者头像,PageUrl等一个视频的完整信息。

  查看该分享视频的url构造可以发现非常的简单,仅由、share 、video 和4423四个部分组成,其中前三部分是固定的,唯一变化的是最后一部分视频ID。按照正常的爬虫逻辑,我们只需要使用脚本不断递增该ID,即可实现遍历所有的视频。

  在实际操作中,抖音对其视频的ID都做了加密处理,简单递增视频ID构造的URL视频显然是不可能成功地。

  但基本在通过Fiddler抓包获取的抖音数据时,你抓取到的字段值和命名方式就能暴露出很多东西了。

  具体情况我就不举例了,如果你对自己账号的以上信息感兴趣,你也可以下载教程脚本,自己尝试去做一下!


本文》有 0 条评论

留下一个回复