Python 3.5 urllib.request 403 禁止错误

2024-02-14

import urllib.request
import urllib
from bs4 import BeautifulSoup


url = "https://www.brightscope.com/ratings"
page = urllib.request.urlopen(url)
soup = BeautifulSoup(page, "html.parser")

print(soup.title)

我试图访问上述网站,但代码不断抛出 403 禁止错误。

有任何想法吗?


import requests
from bs4 import BeautifulSoup


url = "https://www.brightscope.com/ratings"
headers = {'User-Agent':'Mozilla/5.0'}
page = requests.get(url)
soup = BeautifulSoup(page.text, "html.parser")

print(soup.title)

out:

<title>BrightScope Ratings</title>

首先,使用requests而不是urllib.

比,添加headers to requests,如果没有,网站会禁止你的,因为默认User-Agent是爬虫,该网站不喜欢它。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python 3.5 urllib.request 403 禁止错误 的相关文章

  • Python 中最宽容的 HTML 解析器是什么?

    我有一些随机的 HTML 我使用 BeautifulSoup 来解析它 但在大多数情况下 gt 70 它会令人窒息 我尝试使用Beautiful soup 3 0 8和3 2 0 3 1 0以上有一些问题 但结果几乎相同 我可以从我的脑海中
  • SQLite 在使用之间不保存数据

    我制作了一个包含以下内容的模块 import sqlite3 as sq connection sq connect test db cursor connection cursor cursor execute DROP TABLE IF
  • 导入错误:无法导入名称“PandasError”

    我对在 Mac 上运行的 Python 3x 非常陌生 当前使用 python 金融的 senddex 教程 尝试运行以下脚本 import datetime as dt import matplotlib pyplot as plt fr
  • 如果使用 unicode 字符,则从数据库中进行 SELECT 会出现问题

    我在用着latest带DatabaseLibrary的python和机器人框架版本 https franz see github io Robotframework Database Library api 1 0 1 DatabaseLi
  • 从另一个文件覆盖函数中的变量

    一 总结 我不知道如何从另一个文件覆盖函数中的变量 2 示例 2 1 配置 I use logbook http logbook pocoo org and pyfancy https github com ilovecode1 Pyfan
  • 在 Python 中对非英语文本进行分词

    我有一个波斯语文本文件 其中包含如下几行 6 7 10 11 我想从这一行生成一个单词列表 对我来说 单词边框是数字 比如上面一行中的 6 7 等 还有 特点 所以列表应该是 我想在 Python 3 3 中执行此操作 最好的方法是什么 我
  • Python 中 eval("input()") 和 eval(input()) 之间的区别

    我正在尝试以下功能 x eval input 输入为 123 x 的类型也是int 它工作正常 In 22 x eval input enter enter 123 In 24 print type x
  • Firebase HTTP 云函数 HTTP 错误代码 403

    自 2020 年 3 月 28 日起 我的所有 HTTP 云函数都出现错误 在我上次更新之前 它们运行良好 我只更改了一些内容 在上次部署后我收到了此错误 h1 Error Forbidden h1 h2 Your client does
  • 在 Python 中使用 mca 包

    我正在尝试使用MCA 套餐 https github com esafak mca blob master docs usage rst在Python中进行多重对应分析 我对如何使用它有点困惑 和PCA我希望fit一些数据 即找到这些数据的
  • Git 子模块:[电子邮件受保护]:权限被拒绝(公钥)。致命:无法从远程存储库读取

    我有一个问题git submodule update init remote 我收到错误 权限被拒绝和克隆失败 但我将 SSH 密钥添加到了我的 github 存储库中 我可以拉 推 git 克隆 我拥有所有需要的访问权限 我使用操作系统
  • 如何看待Python的负数按位运算?

    我发现很难思考 Python 和 Python3 的无限精度负数和按位运算 它不是 32 位或 64 位 这1左边的 s 可以被认为是 无穷多个 它不是很明确 这就是为什么有时很难思考它是如何运作的 似乎一种可行的方法是 总是让它更多 例如
  • Python BS4 Scraper 仅返回每个页面的前 9 个结果

    我让这段代码按预期工作 只是它并没有完全按预期工作 一切似乎都很顺利 直到我检查了我的 csv 输出文件并注意到我每页只得到前 9 个结果 每页应该有 40 个结果 因此我得到的结果少于预期的 25 有什么想法吗 import reques
  • 计算网页内的字数

    我需要使用 python3 计算网页内的单词数 我应该使用哪个模块 网址库 这是我的代码 def web f urllib request urlopen https americancivilwar com north lincoln h
  • Keras ImageDataGenerator 相当于 csv 文件

    我在文件夹中排序了一堆数据 如下图所示 我需要构建一个 DataIterator 以便将数据放入神经网络模型中 当数据是图像时 我找到了很多例子来解决这个问题 使用 Keras 类图像数据生成器及其方法流自目录 但当数据是 csv 结构时则
  • 在 Python 中快速确定小于 10 亿的数字是否为素数

    我目前在 python 中检查数字素数的算法对于 1000 万到 10 亿之间的数字来说速度很慢 我希望它能够得到改进 因为我知道我永远不会得到超过 10 亿的数字 背景是我无法获得足够快的实现来解决项目 Euler 的问题 60 我在 7
  • 使用 asyncio 时应该如何创建属性?

    在创建使用 asyncio 的类时 我发现自己处于属性 getter 需要进行 io 操作的情况 因此该函数应该是一个协程 然而 等待房产的感觉却很不寻常 这是我的意思的一个最小的例子 该代码有效并且可以运行 import asyncio
  • Python 3.6 ZeroMQ (PyZMQ) asyncio pub sub Hello World

    我刚刚开始使用 ZeroMQ 我正在尝试让 Hello World 在 Python 3 6 中与 PyZMQ 和 asyncio 一起使用 我试图将模块的功能与发布 订阅代码分离 因此有以下类设置 Edit 1 最小化示例 Edit 2
  • 如何在 Python 中根据日期列绘制分类变量

    我有这样的数据 Date Fruit 2017 01 01 Orange 2017 01 01 Apple 2017 01 08 Orange 2017 01 09 Orange 2017 01 09 Apple 我想在一个图中按日期绘制橙
  • pip3:错误的解释器:没有这样的文件或目录

    我正在尝试使用安装依赖项pip3 command 当前场景 Dev which python Users Dev anaconda bin python Dev which python3 usr local bin python3 Dev
  • 将一维数组转换为下三角矩阵

    我想将一维数组转换为较低的零对角矩阵 同时保留所有数字 我知道numpy tril函数 但它用零替换了一些元素 我需要扩展矩阵以包含所有原始数字 例如 10 20 40 46 33 14 12 46 52 30 59 18 11 22 30

随机推荐

  • 如何从 Azure ML Pipeline 脚本步骤注册模型

    我正在运行pipeline submit 在 AzureML 中 它有一个PythonScriptStep 在此步骤中 我从tensorflow hub下载一个模型 重新训练它并将其保存为 zip 最后 我想将其注册到 Azure ML 中
  • Microsoft ADD - 应用程序注册 - 请求中指定的回复 url 与配置的回复 url 不匹配

    我创建了一个使用 Azure Active Directory 身份验证的 Web 应用程序 在 localhost 上一切正常 但当我将应用程序发布到 Azure 时 出现以下错误 AADSTS50011 请求中指定的回复 URL 与 为
  • ms word 2010宏如何选择特定页面上的所有形状

    命令 ActiveDocument Pages 1 Shapes Range Select 似乎在Word 2010中不起作用 它曾经在Word 2003中起作用 我需要选择指定页面 例如第 1 页 上的所有形状 然后删除 300 页 Wo
  • kdb+:用 0 替换空整数

    考虑下表 myTable a b 1 2 3 10 4 50 5 30 如何替换空单元格b带零 所以结果是 a b 1 0 2 0 3 10 4 50 5 30 现在我正在做 myTable update b x 0Ni 0 x b fro
  • Android 4.4 (API 19) 上的 MediaPlayer 流媒体问题

    我的应用程序在 MediaPlayer 流媒体播放方面出现问题 特别是在 Nexus 5 上 我不确定这是否是 Nexus 5 或 API 级别 19 导致的问题 基本上我的 MediaPlayer 已经准备好了 我打电话MediaPlay
  • Prettier 使用 pre-commit(.com) 不会重新暂存更改

    我开始使用 Prettier eslint 使用pretty quick husky option 2 https prettier io docs en precommit html 它的行为符合预期 即在提交 或修改 期间重新格式化代码
  • Heroku CLI 在 Ubuntu 16.04 上无响应

    我正在尝试在 Ubuntu 16 04 上安装 heroku cli 遵循此处的文档 Heroku CLI 文档 https devcenter heroku com articles heroku cli download and ins
  • 更改 NSLayoutConstraint 常量在layoutSubviews中不起作用

    当视图动画为横向模式时 我试图更改 UIButton 的宽度 但是该方法被调用是因为我在那里设置了断点 但按钮的宽度没有改变 我将 IBOutlet 约束添加到按钮的宽度 名为 globalButtonWidthConstraint 我当前
  • 如何使该链接在 JQuery UI 自动完成中可单击?未捕获的类型错误

    我正在尝试使用 Jquery UI 自动完成插件 并且我想在建议框中呈现一些 html 并带有可点击的链接 html 似乎呈现正常 但是当我单击链接时 它们不起作用 并且我进入了我的开发人员日志 jquery ui min js 239Un
  • 子例程是否应该始终显式返回?

    If perlcritic http www perlcritic org 说 子项中没有返回值是错误的 如果确实不需要它们 还有什么选择 我养成了两个明显的坏习惯 我显式地将变量分配给 main 命名空间 然后我在 subs 中使用这些变
  • 使用 Swift 组合创建计时器发布器

    我一直在看通过 SwiftUI 的数据流 WWDC 演讲 https developer apple com videos play wwdc2019 226 他们有一张包含示例代码的幻灯片 其中使用连接到 SwiftUI 视图的计时器发布
  • 从 chrome 获取密码

    是否可以在 Chrome 扩展程序中访问保存的密码 我正在查看 API 但没有找到它 我想将所有密码导出到不同的存储中 并且使用扩展似乎是合乎逻辑的方法 但我找不到如何做到这一点 谢谢你的帮助 好的 回答我自己的问题 似乎不可能通过扩展 A
  • 未生成新随机数

    您好 当我运行这段代码并返回错误距离时 不会生成新的随机数 不断生成相同的随机数 从而使我陷入无限循环 有谁知道为什么会发生这种情况 感谢您的关注 private void setRandomVerticies generate 200 t
  • 当前分支未配置为 pull 在配置中未找到 keybranch.master.merge 值

    当我尝试使用 Egit team gt pull 从远程存储库拉取时出现此错误 当前分支未配置为 pull 无值 key 在配置中找到branch master merge 您的本地 master 分支未设置为跟踪远程 master 分支
  • 一对多连接并检索单个结果

    我有两个表 在 PostgreSQL 中 如果重要的话 具有一对多关系 我需要加入它们 以便对于每个 一 我只能从 多 表中获得单个结果 不仅如此 我还需要从 许多 表中挑选出具体的结果 TABLE A ID NAME DATE MORE
  • Android 和 Arduino 都通过蓝牙接收奇怪的值

    我正在 Android 端使用 BluetoothChat 代码使用聊天框向 Arduino UNO 发送开 关信号 我发送 110 119 或下面定义的其他情况 但是当我显示接收到的值时 它显示奇怪的Arduino 串行监视器中的值 即
  • 从Word文档中获取标题

    如何使用VBA获取Word文档中所有标题的列表 你的意思是这样创建大纲 http msdn microsoft com en us library bb960898 aspx函数 实际上将源 Word 文档中的所有标题复制到新的 Word
  • Python pandas 数据框中的每个数字四舍五入 2 位小数

    这有效p table apply pd Series round 但是它没有小数位 文件说 http pandas pydata org pandas docs stable generated pandas Series round ht
  • 如何在 PyQT 小部件中嵌入 Python 解释器

    我希望能够从我的 python 应用程序中调出交互式 python 终端 我的程序中的一些 但不是全部 变量需要暴露给解释器 目前我使用子类和修改后的QPlainTextEdit并将所有 命令 路由到eval or exec 并跟踪字典中的
  • Python 3.5 urllib.request 403 禁止错误

    import urllib request import urllib from bs4 import BeautifulSoup url https www brightscope com ratings page urllib requ