selenium在执行phantomjs的API并获取执行结果的方法-创新互联

前言

成都创新互联公司业务包括:成品网站、企业产品展示型网站建设、高端网站设计、电子商务型网站建设、成都外贸网站制作(多语言)、成都商城网站开发、按需开发、全网整合营销推广等。效率优先,品质保证,用心服务是我们的核心价值观,我们将继续以良好的信誉为基础,秉承稳固与发展、求实与创新的精神,为客户提供更全面、更优质的互联网服务!

因为最近要写一个抓取sitemap和相应的参数的小脚本,现有的爬虫无论用什么语言写的,几乎都无法抓取参数,所以我思考了一下,先做一个简单的总结。

本来以为写个这种sitemap的爬虫很简单,经过思考之后才发现其中的可怕之处,最关键的是参数的提取,这个太麻烦了。。。这个时候才发现AWVS的无敌和强大之处。。。

如果我们要获取网站的sitemap同时还要抓取对应链接的参数,我大概总结了url的几个来源:

1、页面上直接现有的form表单以及现有的href等指向的链接及参数,这个相对比较简单,不过要考虑post和get的问题。

2、由js生成的DOM中的form表单和href指向的链接

3、由js发起的访问请求,例如AJAX请求等

4、通过点击然后调用js发送请求,或是点击生成一个form或是生产一个DOM,然后再点击再由js发送请求。例如如下代码

 

标题名称:selenium在执行phantomjs的API并获取执行结果的方法-创新互联
文章分享:http://csruizhi.cn/article/dghdpj.html

其他资讯

Copyright © 2007-2024 成都优众联杰科技有限公司 All Rights Reserved 蜀ICP备2024116266号
友情链接: 重庆网站建设 成都网站建设 达州网站设计 品牌网站建设 成都网站设计 温江网站设计 阿坝网站设计 高端网站设计推广 营销型网站建设 成都网站建设 网站制作 外贸营销网站建设 LED网站设计方案 成都网站制作 成都网站建设公司 成都响应式网站建设公司 外贸网站建设 成都网站设计 成都h5网站建设 网站建设公司 成都网站制作 定制网站建设