免费网络爬虫开发最新智慧树知到答案-公众号-聚合答案库-聚合答案库-不限次数查题！

免费网络爬虫开发最新智慧树知到答案-公众号-聚合答案库

作者：2023-03-04 00:00 点赞收藏热度：17

1、单选题：
下列不属于常见爬虫类型的是（）。
选项：
A:增量式网络爬虫
B:通用网络爬虫
C:浅层网络爬虫
D:聚焦网络爬虫
答案: 【浅层网络爬虫】

2、单选题：
下列不属于聚焦网络爬虫的常用策略的是（）。
选项：
A:基于内容评价的爬取策略
B:基于深度优先的爬取策略
C:基于链接结构评价的爬取策略
D:基于语境图的爬取策略
答案: 【基于深度优先的爬取策略】

3、单选题：
下列不属于常用反爬手段的是（）。
选项：
A:人工筛选
B:反爬频度
C:账号权限
D:验证码校验
答案: 【人工筛选】

4、单选题：
下列属于反爬虫目的的是（）。
选项：
A:限制用户访问权限
B:限制访问人数
C:防止网站信息被竞争对手随意获取
D:变换网页结构
答案: 【防止网站信息被竞争对手随意获取】

5、单选题：
下列属关于Python爬虫库的功能描述不正确的是（）。
选项：
A:HTML/XML解析器pycurl`
B:通用爬虫库urllib3
C:爬虫框架 Scrapy
D:通用爬虫库 Requests
答案: 【HTML/XML解析器pycurl`】

6、判断题：
搜索引擎使用了网络爬虫不停地从互联网抓取网站数据，并将网站镜像保存在本地。（）
选项：
A:错
B:对
答案: 【对】

7、判断题：
robots.txt文件中，User-agent后面跟的是爬虫的名称，Disallow后面跟着的是可以爬虫的网页。（）
选项：
A:错
B:对
答案: 【错】

8、判断题：
爬虫是手动请求万维网网站且提取网页数据的程序。（）
选项：
A:对
B:错
答案: 【错】

9、判断题：
每个网站都有robots.txt文件。（）
选项：
A:错
B:对
答案: 【错】

10、判断题：
爬虫爬取的是网站后台的数据。（）
选项：
A:对
B:错
答案: 【错】

欢迎您对本文章进行评论

文明留言，请勿恶意评论，包括但不限于纯数字、敏感内容、非法昵称等

暂无讨论，说说你的看法吧