[微信开发]
Python从某信某公众号内的数据查询程序中爬取查询结果
任务编号:519078
悬赏任务3000元
悬赏任务 : 按雇主需求进行任务后提交稿件,被采纳后即获得佣金。
Python从某信某公众号内的数据查询程序中爬取查询结果
距截止:
任务已圆满完成
雇主已托管赏金:3000 元
雇主发布需求
雇主托管佣金
服务商投稿
雇主开始选稿
任务完成
任务大厅共需1个合格投稿 | 每稿将获得3000 元 | 每人交稿次数不限 可多次任务
投诉举报
联系Ta
我来承接
已有1 个投稿 | 已采纳1 稿 | 拒绝0 稿 | 目前中标名额已满
任务需求:
概要描述:从某信某公众号内的数据查询程序中,爬取查询结果,并将结果存储在本地的文件中。
详细需求:
通过访问固定的网络地址,使用合法的账号密码登录,通过验证后进入查询系统。
查询系统中的功能非常简单,通过在本地Excel文件中读取一条32位字符串,录入到查询框中,点击查询按钮,获开查询结果。查询结果有三种,第一种为获得4行14个字符串的数据,第二种为获得12行14个字符串的数据,第三种为查询错误。本地Excel文件中有多行数据,需要爬虫程序不断的循环查询,直到Excel文件中最后一行数据为止。
将正确的查询结果放置在新生成的excel文件中,分为两列存放,一列为32位字符串,第二列为查询后得到的14个字符串;将错误的结果放置在txt文件中,只需将32位字符串记录在此即可。
项目情况:
1、该公众号所连接的数据查询网站属于上游供应链厂家系统,不存在爬取数据违规处罚的情况。
2、数据查询网站使用.net开发,可通过定义浏览器header,脱离某信运行。
3、数据查询网站中有302跳转和doPostBack方法,如开发者对该方式爬取数据没有经验,不建议接单。
4、查询数据时需要间隔2秒,否则会出现频繁查询的情况。
|
|
|
|
|