22春学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业-00002

未知 试卷 2022-08-29 806

摘要:1、[判断题] 为了保证数据插入效率,在内存允许的情况下,应该一次性把数据读入内存,尽量减少对MongoDB的读取操作。A、对B、错 2、[单选题] HTTP常用状态码表明服务器正忙的是()A、500B、503C、403D、404 3、[单选题] 在Scrapy的目录下,哪个文件...

1、[判断题] 为了保证数据插入效率,在内存允许的情况下,应该一次性把数据读入内存,尽量减少对MongoDB的读取操作。

A、对

B、错

 2、[单选题] HTTP常用状态码表明服务器正忙的是()

A、500

B、503

C、403

D、404

 3、[单选题] 在Scrapy的目录下,哪个文件负责存放爬虫文件?()

A、spiders文件夹

B、item.py

C、pipeline.py

D、settings.py

 4、[判断题] PyMongoDB中排序方法sort第二个参数-1表示升序

A、对

B、错

 5、[判断题] Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库

A、对

B、错

 6、[判断题] middlewares.py是下载器中间件

A、对

B、错

 7、[判断题] requests中post请求方法的使用为requests.post('网址', data=data)

A、对

B、错

 8、[多选题] 常用的会话跟踪技术是

A、session

B、cookies

C、moonpies

D、localstorage

 9、[单选题] 如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为(),Value就是一个集合。

A、字典

B、集合的名字

C、集合

D、文档

 10、[单选题] 如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个()

A、列表

B、元组

C、字典

D、集合

 11、[多选题] 最常见的HTTP请求类型有()

A、GET

B、POST

C、SEND

D、RECEIVE

 12、[判断题] 使用UI Automatorr操作实体键的命令为device.press.实体按键名称()

A、对

B、错

 13、[单选题] 以下哪个命令是利用URL语法在命令行下工作的文件传输工具()

A、curl

B、tar -zxvf

C、mkdir

D、cp

 14、[判断题] 需要实名认证的打码网站更加安全可靠。

A、对

B、错

 15、[判断题] MongoDB是一个关系数据库产品

A、对

B、错

 16、[判断题] 在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装

A、对

B、错

 17、[判断题] 操作文本难以实现自动化,而操作图形界面可以容易的实现自动化。

A、对

B、错

 18、[多选题] 下载器中间件的作用有哪些?

A、更换代理IP

B、更换Cookies

C、更换User-Agent

D、自动重试

 19、[单选题] Python读CSV文件需要哪个方法()

A、CSVReader

B、CsvReader

C、DictReader

D、FileReader

 20、[判断题] Cookies一般包含在请求头Headers中

A、对

B、错

 21、[单选题] 请问按哪个键可以打开Chrome自带的开发者工具()

A、F10

B、F1

C、F11

D、F12

 22、[单选题] 如果计算机上连接了很多台手机,查看这些手机串号,需要在终端输入以下命令:()

A、adb device

B、adb devices

C、adb devices -l

D、adb devices -list

 23、[判断题] 当Charles抓包以后,在Mac OS系统下可以按Command F组合键,在Windows系统下按Ctrl F组合键打开Charles进行搜索

A、对

B、错

 24、[判断题] HTTP状态码302表示资源永久重定向。

A、对

B、错

 25、[单选题] 如果很多爬虫同时对一个网站全速爬取,那么其实就是对网站进行了()攻击

A、XSS

B、DOS

C、DDOS

D、跨域

 26、[单选题] 执行下面代码,结果为(): name_list = [] if name_list and name_list[100] == '张三': print('OK')

A、程序报错

B、OK

C、NULL

D、无输出

 27、[单选题] 某些网站在发起Ajax请求时会携带()字符串用于身份验证

A、Token

B、Cookie

C、ReqTime

D、sum

 28、[单选题] 一般来说在页面传输登录信息都用HTTP()请求类型

A、GET

B、POST

C、PUT

D、SEND

 29、[判断题] 验证码必须通过手动填充识别。

A、对

B、错

 30、[单选题] PyMongo中查询所有age > 29的记录是()

A、collection.find({'age': {'$gt': 29}})

B、collection.find({'age'>29})

C、collection.find_all({'age': {'$gt': 29}})

D、collection.find_all({'age'>29})

 31、[多选题] Python中有哪些实现多线程方法()

A、multiprocess.dummy

B、threading.Thread

C、process

D、PyMongoDB

 32、[多选题] 以下哪些方法属于Python写CSV文件的方法()

A、writeheaders

B、writeheader

C、writerrows

D、writerow

 33、[单选题] Python中列表可以用()方法在末尾添加元素

A、add

B、append

C、plus

D、

 34、[多选题] Redis中的值可以支持()

A、列表

B、哈希

C、集合

D、有序集合

 35、[单选题] Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_3','3')是()

A、1

B、2

C、3

D、无输出

 36、[多选题] 使用Selennium获取网页中元素的方法有

A、find_element_by_name

B、find_element_by_id

C、find_elements_by_name

D、find_elements_by_id

 37、[判断题] device.sleep()方法是使用UI Automatorr关闭屏幕的命令

A、对

B、错

 38、[判断题] scrapy与selenium结合可以实现直接处理需要异步加载的页面

A、对

B、错

 39、[多选题] HTTP常用状态码表明请求被正常处理的有()

A、200

B、301

C、302

D、204

 40、[多选题] Python中哪种容器生成后可以修改内容

A、列表

B、元组

C、字典

D、集合

 41、[单选题] 以下哪个命令是创建文件夹命令()

A、curl

B、tar -zxvf

C、mkdir

D、cp

 42、[单选题] Redis中读取数据语句lrange chapter 0 3,那么表示读列表中()个值

A、2

B、3

C、4

D、5

 43、[多选题] 要使用tesseract来进行图像识别,需要安装两个第三方库

A、requests

B、beautifulsoup

C、Pillow

D、pytesseract

 44、[判断题] cookies在http请求中是明文传输的。

A、对

B、错

 45、[单选题] Python中若定义object=[1, 2, 3, 4, 5],则print(object[-4])输出()

A、NULL

B、2

C、4

D、程序报错

 46、[单选题] 在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?()

A、spiders文件夹

B、item.py

C、pipeline.py

D、settings.py

 47、[判断题] HTTP状态码503表示服务器内部故障。

A、对

B、错

 48、[判断题] Python中函数返回值的个数可以是多个

A、对

B、错

 49、[判断题] 所有的异步加载都会向后台发送请求

A、对

B、错

 50、[单选题] 在Mac OS下安装MongoDB使用命令() install mongodb

A、brew

B、apt-get

C、sudo

D、apt

 
相关推荐

评论列表
友情链接
关闭

用微信“扫一扫”