[采集工具]
用python写一个B站数据采集工具程序
任务编号:58389
悬赏任务1000元
悬赏任务 : 按雇主需求进行任务后提交稿件,被采纳后即获得佣金。
用python写一个B站数据采集工具程序
距截止:
任务已圆满完成
雇主已托管赏金:1000 元
雇主发布需求
雇主托管佣金
服务商投稿
雇主开始选稿
任务完成
任务大厅共需1个合格投稿 | 每稿将获得1000 元 | 每人交稿次数不限 可多次任务
投诉举报
联系Ta
我来承接
已有1 个投稿 | 已采纳1 稿 | 拒绝0 稿 | 目前中标名额已满
任务需求:
可以根据搜索网址爬取当前指定页的搜索结果,比如你搜索“美妆”,然后点时尚区,出现了45页,要求可以爬取前30页(可指定)所有视频的视频名称,视频描述,视频网址,视频播放量以及前5条评论。导出结果为excel格式。
要求要使用代理池,代理池可以是收费的那种,最近b站防爬升级了,我自己搞不定了,使用的代理一下就不行了。前面的其实都好说,我是用selenium写的,具体的xpath等选择元素的语句可以和我沟通。
|
|
|
|
|