将 HTML 源代码保存到文件

2023-11-24

如何在 Python 3 中将网站的源代码复制到文本文件中？

编辑：为了澄清我的问题，我有以下内容：

import urllib.request

def extractHTML(url):
    f = open('temphtml.txt', 'w')
    page = urllib.request.urlopen(url)
    pagetext = page.read()
    f.write(pagetext)
    f.close()

extractHTML('http:www.google.com')

我收到 f.write() 函数的以下错误：

builtins.TypeError: must be str, not bytes

import urllib.request
site = urllib.request.urlopen('http://somesite.com')
data = site.read()
file = open("file.txt","wb") #open file in binary mode
file.writelines(data)
file.close()

未经测试但应该可以。

编辑：针对 python3 进行了更新

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

将 HTML 源代码保存到文件的相关文章

将列名与第一行的数据连接起来，Python 3.6 Dataframe

我想将数据框第一行的数据添加到其列名称并删除第一行源数据框 2013K2 2013K3 2013K4 2013K5 ABC1 ABC2 ABC3 ABC4 324 5435 543 543 6543 543 657 765 765 876
Python ctypes from_buffer 使用上下文管理器映射到内存映射文件（mmap）

我在用着ctypes from buffer 将 ctypes 结构映射到内存映射文件以执行某些任务通常这些文件包含结构化标头和二进制数据的串联 ctypes 结构允许稳定的二进制表示和对字段的简单 Python 访问在这方面是真正的
如何在matplotlib中部分填充之间，如不同值的不同颜色

I m trying to color the space between the graph line and the x axis The color should be based on the value of the corres
是否可以将 ppm 文件从 p3 转换为 p6 或使用pillow lib 打开 ppm p3 文件

是否可以将 ppm 文件从 p3 转换为 p6 或使用pillow lib 打开并读取 ppm p3 文件我实际上有 ppm p3 文件并尝试使用pillow lib 将它们转换为 jpg 但不幸的是它不读取 p3 文件只读取 p6
如何让 Discord 机器人显示“机器人正在输入...”状态？

所以如果我有一个像这样的长命令 bot command pass context True async def longCommand ctx typing status sleep 10 bot say Done 不幸的是在文档或此处没
QuantLib：构建关键利率风险

我能够为国债市场建立一条贴现曲线然而我希望用它来找出单个债券最终是债券投资组合的关键利率风险我正在寻找的关键利率风险是如果我拥有 30 年期债券并且我们改变用于贴现债券的 1 年期利率同时保持其他利率不变那么债券的价格会变
Python 字典不按顺序排列

我创建了一个字母表字典其值从0开始并根据单词文件增加一定的量我对最初的字典进行了硬编码我希望它保持按字母顺序排列但事实并非如此我希望它按字母顺序返回字典基本上与初始字典保持相同我怎样才能保持秩序 from wordData
NumPy：linalg.eig() 和 linalg.eigh() 之间的区别

在 Python 3 应用程序中我使用 NumPy 来计算对称实矩阵的特征值和特征向量这是我的演示代码 import numpy as np a np random rand 3 3 generate a random array sh
如何在 pygame 中水平翻转图像？

这是在 pygame 如何翻转图像假设一个图像猪向右看时向左看我按向左箭头键然后保持这样即使我不按任何键或者按向上和向下箭头键那么当我按向右箭头键时如何再次将其切换回向右看并使其保持这种状态即使我不按任何键或按向上和向
通过服务器端的服务帐户使用 gmail api，避免使用 OAUTH2 GUI

我有一个用 python 开发的应用程序它使用 SMTP 服务连接到 gmail 帐户这种类型的连接典型为访问不安全的应用程序不太安全的应用程序 https myaccount google com lesssecureapps 为
numpy.nan_to_num - 'nan' 关键字无法识别

当您尝试使用以下代码将 nan 值替换为自定义数值时 np nan to num exp allowance nan 9999 99 它产生以下错误 typeerror nan to num got an unexpected keywor
将 async-for 与 if 条件结合起来以中断中间等待的正确方法是什么？

如果我有一个协程正在消耗异步生成器中的项目那么从外部条件终止该循环的最佳方法是什么考虑到这一点 while not self shutdown event is set async with self external lib cl
numpy 数组的 True 和 False 索引

Code import numpy as np a np arange 5 print a True print a False Result 0 1 2 3 4 对于上面的代码当我将 True 传递给 numpy 数组的索引时它返回完
向 Python 函数添加属性的最佳方法

以计算数学函数的 Python 函数为例 def func x a b c Return the value of the quadratic function ax 2 bx c return a x 2 b x c 假设我想以函数属性的
初始化整数变量以进行比较

我正在学习麻省理工学院的开放课件课程计算机科学和 Python 编程简介 https ocw mit edu courses electrical engineering and computer science 6 0001 introd
如果出现重复，则主键取正值

我有一个数据框df Key1 Key2 Value K11 K21 V1 K11 K21 V1 K13 K23 V2 K13 K23 V2 现在例如对于相同的键 K11 K21 组合我们有 2 个值一负一正如何从此 df 中仅获取正
数据帧中标志切换之间的行的总和/平均值

我有一个像这样的数据框 id power flag 0 20 0 1 25 0 2 26 1 3 30 1 4 18 0 5 30 0 6 19 0 7 21 1 8 23 0 我正在尝试获取行的平均值总和power柱子输出应该是这样的
如何使用 pyinstaller 包含文件？

我也使用 tkinter 使用 python 3 7 编写了一个程序由于我使用的是外部图片因此当我将所有内容编译为一个 exe 时我需要包含它们我试过做 add data bg png files 但我仍然收到此错误 tkinter
Tweepy StreamListener 到 CSV

我是 python 新手我正在尝试开发一个应用程序使用 Tweepy 和 Streaming API 从 Twitter 检索数据并将数据转换为 CSV 文件问题是此代码不会创建输出 CSV 文件也许是因为我应该将代码设置为在实现例
在 macOS 中通过 Python 访问进程的压缩 RAM（顶部的 CMPRS）的方法？

我试图弄清楚如何从 Python 访问任何给定进程占用的实际 RAM 量我发现 psutil Process PID memory info rss 工作得很好直到操作系统决定开始压缩某些进程的 RAM 然后所有的 memory in

随机推荐

扩展 Node.js 中的 TypeScript Global 对象

我有一个 node js 应用程序它将一些配置信息附加到global object global myConfig a 1 b 2 TypeScript 编译器不喜欢这样因为Global类型没有名为的对象myConfig TS2339
如何将 WebBrowser 渲染到设备上下文？

我想渲染一个网页即TWebBrowser 到设备上下文我想使用 Internet Explorer 的布局引擎将内容呈现到设备上下文即图元文件 pdf 图元文件从 Internet Explorer 9 开始IHTMLElement
350GB SVN 存储库至少为分支/标签等最简单的任务创建了 1MB 修订版

当我注意到我的存储库大小以每天 1GB 的速度增加时这一切就开始了我做了一个简单的测试创建了大小为 35KB 的现有文件夹的分支标签我记下修订号并转到 REPO db revs
使用 IronPython 通过 C# .NET 导入 Python 模块

我正在尝试使用 IronPython 通过 C NET 运行 Python 类 Python 类导入的几个模块是 import collections import nltk classify util 为了在运行 IronPython 时
Django 1.2 对象级权限 - 第三方解决方案？

Locked 这个问题及其答案是locked因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动由于 Django 1 2 Final 即将发布我很好奇是否已经有项目使用新的对象级权限行级权限系统 Django 权威这是
原因：retrofit.RetrofitError：方法 POST 必须有请求正文

我正在使用 Retrofit 进行 API 后调用在尝试访问端点时收到以下错误 Caused by rx exceptions OnErrorNotImplementedException method POST must have a
UNIX 域套接字和 Cocoa

我想在 Cocoa 应用程序中使用 UNIX 域套接字实现 IPC 但我对此没有经验我找到了苹果的CF本地服务器示例项目但它是用 C 编写的看起来相当复杂是的我已经阅读了其中的大部分内容 CFLocalServer 中演示的技术是
使用 groupby 获取组中具有最大值的行

如何找到 pandas DataFrame 中具有最大值的所有行count分组后的列 Sp Mt 列示例1 以下数据框 Sp Mt Value count 0 MM1 S1 a 3 1 MM1 S1 n 2 2 MM1 S3 cb 5 3
为什么必须定义未使用的虚函数？

我觉得很奇怪的是与未使用的普通函数不同未使用的虚拟函数仍然必须被定义我对隐含的内容有些了解vtables and v指针它们是在创建类对象时创建的这在某种程度上回答了这个问题必须定义该函数以便可以定义指向虚函数的指针但这将我的
在 cabal 上使用 extra-lib-dirs 的相对路径

我有一个 C 库 myboo 其中包含 Makefile 我想制作这个库的包装我不想将其安装到 usr local 中因为 myboo 不是主要模块另外建议我构建 myboo 而不是动态库但作为静态库我制作自定义Setup py
Dapper 和 MS Access - 读取有效，写入无效

让我们首先解决这个问题我一直在使用 MS Access DB 而且无法更改它这工作正常 using OleDbConnection conn ConnectionHelper GetConnection conn Open var re
Grails 文件上传问题

我正在尝试模拟 grails 网站的文件上传代码但遇到了一些问题我使用的代码与找到的相同here 这是我的代码
从外部调用 React 组件方法

我想从 React 元素的实例调用 React 组件公开的方法例如在这个jsfiddle 我想打电话给alertMessage方法从HelloElement参考有没有一种方法可以实现这一点而无需编写额外的包装器 Edit 从 JSFi
XSLT 样式表用空的配对标签替换自关闭标签

我正在使用 XSLT 处理 ASP Net web config 文件以插入一些额外的 log4net 配置它由称为 NANT 标准任务的应用
Firebase Unity3D 桌面应用程序 (Mac/PC) - 是否有效？

Firebase 在此处的文档中文件 A https firebase google com docs unity setup 它声称它现在适用于桌面版本因此您可以统一创建 Mac 应用程序或 Windows 应用程序它确实可以在
动态单选按钮控制

代码 private void createRadioButton final RadioButton rb new RadioButton 5 for int i 0 i lt 5 i rb i new RadioButton this
实体框架：单例 ObjectContext - 好、坏还是想太多？

这个想法是创建一个公开上下文但处理它在 Web 应用程序中的存储的类目前这就是我所拥有的 public class EntityContext private static String MAIN CONTEXT KEY MainCon
GAE/J 请求日志格式细分

以下是 GAE 控制台日志记录的示例 https i stack imgur com M2iJX png for readable high res version 我想提供文件的详细信息显示在折叠摘要视图和展开详细视图中我将填
有人成功构建了 Cygwin 版本的 GHC 吗？

有没有人成功构建了 GHC 的 Cygwin 版本自从 Haskell 从使用 Cygwin 切换到 MinGW 来自哈斯克尔网站 GHC 的目标是 MinGW 而不是 Cygwin 原则上可以构建一个针对 Cygwin 的 GHC 版本
将 HTML 源代码保存到文件

如何在 Python 3 中将网站的源代码复制到文本文件中编辑为了澄清我的问题我有以下内容 import urllib request def extractHTML url f open temphtml txt w page ur

将 HTML 源代码保存到文件

将 HTML 源代码保存到文件 的相关文章

随机推荐

热门标签

将 HTML 源代码保存到文件的相关文章