Python 3.5 urllib.request 403 禁止错误

2024-02-14

import urllib.request
import urllib
from bs4 import BeautifulSoup


url = "https://www.brightscope.com/ratings"
page = urllib.request.urlopen(url)
soup = BeautifulSoup(page, "html.parser")

print(soup.title)

我试图访问上述网站，但代码不断抛出 403 禁止错误。

有任何想法吗？

import requests
from bs4 import BeautifulSoup


url = "https://www.brightscope.com/ratings"
headers = {'User-Agent':'Mozilla/5.0'}
page = requests.get(url)
soup = BeautifulSoup(page.text, "html.parser")

print(soup.title)

out:

<title>BrightScope Ratings</title>

首先，使用requests而不是urllib.

比，添加headers to requests，如果没有，网站会禁止你的，因为默认User-Agent是爬虫，该网站不喜欢它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

beautifulsoup

urllib

httpstatuscode403

Python 3.5 urllib.request 403 禁止错误的相关文章

Python 中最宽容的 HTML 解析器是什么？

我有一些随机的 HTML 我使用 BeautifulSoup 来解析它但在大多数情况下 gt 70 它会令人窒息我尝试使用Beautiful soup 3 0 8和3 2 0 3 1 0以上有一些问题但结果几乎相同我可以从我的脑海中
SQLite 在使用之间不保存数据

我制作了一个包含以下内容的模块 import sqlite3 as sq connection sq connect test db cursor connection cursor cursor execute DROP TABLE IF
导入错误：无法导入名称“PandasError”

我对在 Mac 上运行的 Python 3x 非常陌生当前使用 python 金融的 senddex 教程尝试运行以下脚本 import datetime as dt import matplotlib pyplot as plt fr
如果使用 unicode 字符，则从数据库中进行 SELECT 会出现问题

我在用着latest带DatabaseLibrary的python和机器人框架版本 https franz see github io Robotframework Database Library api 1 0 1 DatabaseLi
从另一个文件覆盖函数中的变量

一总结我不知道如何从另一个文件覆盖函数中的变量 2 示例 2 1 配置 I use logbook http logbook pocoo org and pyfancy https github com ilovecode1 Pyfan
在 Python 中对非英语文本进行分词

我有一个波斯语文本文件其中包含如下几行 6 7 10 11 我想从这一行生成一个单词列表对我来说单词边框是数字比如上面一行中的 6 7 等还有特点所以列表应该是我想在 Python 3 3 中执行此操作最好的方法是什么我
Python 中 eval("input()") 和 eval(input()) 之间的区别

我正在尝试以下功能 x eval input 输入为 123 x 的类型也是int 它工作正常 In 22 x eval input enter enter 123 In 24 print type x
Firebase HTTP 云函数 HTTP 错误代码 403

自 2020 年 3 月 28 日起我的所有 HTTP 云函数都出现错误在我上次更新之前它们运行良好我只更改了一些内容在上次部署后我收到了此错误 h1 Error Forbidden h1 h2 Your client does
在 Python 中使用 mca 包

我正在尝试使用MCA 套餐 https github com esafak mca blob master docs usage rst在Python中进行多重对应分析我对如何使用它有点困惑和PCA我希望fit一些数据即找到这些数据的
Git 子模块：[电子邮件受保护]：权限被拒绝（公钥）。致命：无法从远程存储库读取

我有一个问题git submodule update init remote 我收到错误权限被拒绝和克隆失败但我将 SSH 密钥添加到了我的 github 存储库中我可以拉推 git 克隆我拥有所有需要的访问权限我使用操作系统
如何看待Python的负数按位运算？

我发现很难思考 Python 和 Python3 的无限精度负数和按位运算它不是 32 位或 64 位这1左边的 s 可以被认为是无穷多个它不是很明确这就是为什么有时很难思考它是如何运作的似乎一种可行的方法是总是让它更多例如
Python BS4 Scraper 仅返回每个页面的前 9 个结果

我让这段代码按预期工作只是它并没有完全按预期工作一切似乎都很顺利直到我检查了我的 csv 输出文件并注意到我每页只得到前 9 个结果每页应该有 40 个结果因此我得到的结果少于预期的 25 有什么想法吗 import reques
计算网页内的字数

我需要使用 python3 计算网页内的单词数我应该使用哪个模块网址库这是我的代码 def web f urllib request urlopen https americancivilwar com north lincoln h
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
在 Python 中快速确定小于 10 亿的数字是否为素数

我目前在 python 中检查数字素数的算法对于 1000 万到 10 亿之间的数字来说速度很慢我希望它能够得到改进因为我知道我永远不会得到超过 10 亿的数字背景是我无法获得足够快的实现来解决项目 Euler 的问题 60 我在 7
使用 asyncio 时应该如何创建属性？

在创建使用 asyncio 的类时我发现自己处于属性 getter 需要进行 io 操作的情况因此该函数应该是一个协程然而等待房产的感觉却很不寻常这是我的意思的一个最小的例子该代码有效并且可以运行 import asyncio
Python 3.6 ZeroMQ (PyZMQ) asyncio pub sub Hello World

我刚刚开始使用 ZeroMQ 我正在尝试让 Hello World 在 Python 3 6 中与 PyZMQ 和 asyncio 一起使用我试图将模块的功能与发布订阅代码分离因此有以下类设置 Edit 1 最小化示例 Edit 2
如何在 Python 中根据日期列绘制分类变量

我有这样的数据 Date Fruit 2017 01 01 Orange 2017 01 01 Apple 2017 01 08 Orange 2017 01 09 Orange 2017 01 09 Apple 我想在一个图中按日期绘制橙
pip3：错误的解释器：没有这样的文件或目录

我正在尝试使用安装依赖项pip3 command 当前场景 Dev which python Users Dev anaconda bin python Dev which python3 usr local bin python3 Dev
将一维数组转换为下三角矩阵

我想将一维数组转换为较低的零对角矩阵同时保留所有数字我知道numpy tril函数但它用零替换了一些元素我需要扩展矩阵以包含所有原始数字例如 10 20 40 46 33 14 12 46 52 30 59 18 11 22 30

随机推荐

如何从 Azure ML Pipeline 脚本步骤注册模型

我正在运行pipeline submit 在 AzureML 中它有一个PythonScriptStep 在此步骤中我从tensorflow hub下载一个模型重新训练它并将其保存为 zip 最后我想将其注册到 Azure ML 中
Microsoft ADD - 应用程序注册 - 请求中指定的回复 url 与配置的回复 url 不匹配

我创建了一个使用 Azure Active Directory 身份验证的 Web 应用程序在 localhost 上一切正常但当我将应用程序发布到 Azure 时出现以下错误 AADSTS50011 请求中指定的回复 URL 与为
ms word 2010宏如何选择特定页面上的所有形状

命令 ActiveDocument Pages 1 Shapes Range Select 似乎在Word 2010中不起作用它曾经在Word 2003中起作用我需要选择指定页面例如第 1 页上的所有形状然后删除 300 页 Wo
kdb+：用 0 替换空整数

考虑下表 myTable a b 1 2 3 10 4 50 5 30 如何替换空单元格b带零所以结果是 a b 1 0 2 0 3 10 4 50 5 30 现在我正在做 myTable update b x 0Ni 0 x b fro
Android 4.4 (API 19) 上的 MediaPlayer 流媒体问题

我的应用程序在 MediaPlayer 流媒体播放方面出现问题特别是在 Nexus 5 上我不确定这是否是 Nexus 5 或 API 级别 19 导致的问题基本上我的 MediaPlayer 已经准备好了我打电话MediaPlay
Prettier 使用 pre-commit(.com) 不会重新暂存更改

我开始使用 Prettier eslint 使用pretty quick husky option 2 https prettier io docs en precommit html 它的行为符合预期即在提交或修改期间重新格式化代码
Heroku CLI 在 Ubuntu 16.04 上无响应

我正在尝试在 Ubuntu 16 04 上安装 heroku cli 遵循此处的文档 Heroku CLI 文档 https devcenter heroku com articles heroku cli download and ins
更改 NSLayoutConstraint 常量在layoutSubviews中不起作用

当视图动画为横向模式时我试图更改 UIButton 的宽度但是该方法被调用是因为我在那里设置了断点但按钮的宽度没有改变我将 IBOutlet 约束添加到按钮的宽度名为 globalButtonWidthConstraint 我当前
如何使该链接在 JQuery UI 自动完成中可单击？未捕获的类型错误

我正在尝试使用 Jquery UI 自动完成插件并且我想在建议框中呈现一些 html 并带有可点击的链接 html 似乎呈现正常但是当我单击链接时它们不起作用并且我进入了我的开发人员日志 jquery ui min js 239Un
子例程是否应该始终显式返回？

If perlcritic http www perlcritic org 说子项中没有返回值是错误的如果确实不需要它们还有什么选择我养成了两个明显的坏习惯我显式地将变量分配给 main 命名空间然后我在 subs 中使用这些变
使用 Swift 组合创建计时器发布器

我一直在看通过 SwiftUI 的数据流 WWDC 演讲 https developer apple com videos play wwdc2019 226 他们有一张包含示例代码的幻灯片其中使用连接到 SwiftUI 视图的计时器发布
从 chrome 获取密码

是否可以在 Chrome 扩展程序中访问保存的密码我正在查看 API 但没有找到它我想将所有密码导出到不同的存储中并且使用扩展似乎是合乎逻辑的方法但我找不到如何做到这一点谢谢你的帮助好的回答我自己的问题似乎不可能通过扩展 A
未生成新随机数

您好当我运行这段代码并返回错误距离时不会生成新的随机数不断生成相同的随机数从而使我陷入无限循环有谁知道为什么会发生这种情况感谢您的关注 private void setRandomVerticies generate 200 t
当前分支未配置为 pull 在配置中未找到 keybranch.master.merge 值

当我尝试使用 Egit team gt pull 从远程存储库拉取时出现此错误当前分支未配置为 pull 无值 key 在配置中找到branch master merge 您的本地 master 分支未设置为跟踪远程 master 分支
一对多连接并检索单个结果

我有两个表在 PostgreSQL 中如果重要的话具有一对多关系我需要加入它们以便对于每个一我只能从多表中获得单个结果不仅如此我还需要从许多表中挑选出具体的结果 TABLE A ID NAME DATE MORE
Android 和 Arduino 都通过蓝牙接收奇怪的值

我正在 Android 端使用 BluetoothChat 代码使用聊天框向 Arduino UNO 发送开关信号我发送 110 119 或下面定义的其他情况但是当我显示接收到的值时它显示奇怪的Arduino 串行监视器中的值即
从Word文档中获取标题

如何使用VBA获取Word文档中所有标题的列表你的意思是这样创建大纲 http msdn microsoft com en us library bb960898 aspx函数实际上将源 Word 文档中的所有标题复制到新的 Word
Python pandas 数据框中的每个数字四舍五入 2 位小数

这有效p table apply pd Series round 但是它没有小数位文件说 http pandas pydata org pandas docs stable generated pandas Series round ht
如何在 PyQT 小部件中嵌入 Python 解释器

我希望能够从我的 python 应用程序中调出交互式 python 终端我的程序中的一些但不是全部变量需要暴露给解释器目前我使用子类和修改后的QPlainTextEdit并将所有命令路由到eval or exec 并跟踪字典中的
Python 3.5 urllib.request 403 禁止错误

import urllib request import urllib from bs4 import BeautifulSoup url https www brightscope com ratings page urllib requ

Python 3.5 urllib.request 403 禁止错误

Python 3.5 urllib.request 403 禁止错误 的相关文章

随机推荐

热门标签

Python 3.5 urllib.request 403 禁止错误的相关文章