首页 > python get请求 由于目标机器_使用python和selenium进行Web抓取:由于目标机器主动拒绝i...

python get请求 由于目标机器_使用python和selenium进行Web抓取:由于目标机器主动拒绝i...

我知道这个错误已经被讨论了很多,但似乎每种情况都有不同的原因。

我使用下面的代码和selenium从一个网站提取一些数据,并在第二次调用浏览器.get(url)。在import openpyxl, os

from selenium import webdriver

os.chdir('C://Users/user/Documents')

os.makedirs('GenBank Data', exist_ok = True)

book = openpyxl.load_workbook('Squirrel list 50 percent genus.xlsx')

sheet = book.active

dirs = 'C://Users/user/Documents/GenBank Data'

os.chdir(dirs)

browser = webdriver.Chrome(executable_path = 'C://Users/user/chromedriver.exe',

service_args = ['--ignore-ssl-errors=true', '--ssl-protocol=TLSv1'])

start_col = 7

end_col = 9

start_row = 2

end_row = 160

url_root = 'https://www.ncbi.nlm.nih.gov/nuccore/'

url_end = '.1?report=fasta'

for y in range(start_col, end_col + 1):

file = open(sheet.cell(row = 1, column = y).value, 'w')

for x in range(start_row, end_row + 1):

accession = sheet.cell(row = x, column = y).value

if accession:

print(accession)

url = url_root + accession + url_end

browser.get(url)

data = browser.find_element_by_tag_name('pre')

file.write(data.text + ' ' + ' ')

browser.quit()

file.close()

我使用自己的机器,对服务器和端口的知识有限,这似乎是类似问题答案的重点。任何帮助都将不胜感激。

我已经复制了下面的回溯。在

^{pr2}$

更多相关:

  • Python的WEB框架有Django、Tornado、Flask 等多种,Django相较与其他WEB框架其优势为:大而全,框架本身集成了ORM、模型绑定、模板引擎、缓存、Session等诸多功能。本文将以下方面带大家全面了解Django框架,笔者使用的版本为1.10.流程基本配置路由系统视图view模板Model中间件Form认证...

  •   onReady(){// #ifdef H5// 初始化微信 let url = location.href.split("#")[0];configWxMp({debug: false,jsApiList: ["scanQRCode"],url: this.config.apiList.wxMpConfig,data: {ur...

  • wget -S "http:/192.168.0.102:8080/cache/lookup_url?url=http://www.dnion.com/"...

  • 首先说一下业务需求: 需要在当前各主流浏览器上从tab标签形式弹出一个页面,尽量不要以单独窗口弹出。 下面是网上搜集并修改、验证后的js代码,以备以后参阅。 function getUnionCookie(B) {var A = new RegExp(B + "=([^;]+)"), _ = A.exec(document....

  • while 语句的九九乘法表: ##九九乘法表#总共有九行# 每行中的列数,就是当前所处的行号#乘式的第一个数代表的是列,第二个数代表的是行row = 1#行column = 1#列while row <= 9: while column <= row: print('%d * %d = %d, '%(colum...

  • #encoding=gbk import os import re import math from os import path''' 手动输入文件nmon文件路径,要截取的开始时间,结束时间 '''rootdir='E:\pylianxi\ceshi' #input("请输入文件路径:") start_time="14...

  • 问题1:手动修改的查询语句,放入到项目中后显示结果和实际查询结果不一致 由于实际情况中用的了分页功能,导致最终的语句在查询完成后,添加了分页项,即如下代码。 ROW_NUMBER() OVER ( ORDER BY COLUMNS) PAGE_ROW_NUMBER,   又由于语句是用DISTINCT关键字结尾的,所以最终的语句...