不在网络抓取中迭代列表

2024-01-04

通过链接，我尝试创建两个列表：一个用于国家/地区，另一个用于货币。但是，我陷入了困境，它只给了我第一个国家/地区名称，但没有迭代到所有国家/地区的列表。任何有关如何解决此问题的帮助将不胜感激。提前致谢。

这是我的尝试：

from bs4 import BeautifulSoup
import urllib.request

url = "http://www.worldatlas.com/aatlas/infopage/currency.htm"
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 
10_10_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 
Safari/537.36'}

req = urllib.request.Request(url, headers=headers)
resp = urllib.request.urlopen(req)
html = resp.read()

soup = BeautifulSoup(html, "html.parser")
attr = {"class" : "miscTxt"}

countries = soup.find_all("div", attrs=attr)
countries_list = [tr.td.string for tr in countries]

for country in countries_list:
    print(country)

您还可以使用单个理解列表来制作元组列表，例如[(country, currency)]& 然后将元组转换为 2 个列表地图和邮政编码 https://stackoverflow.com/a/21867333/2614364 :

temp_list = [
    (t[0].text.strip(), t[1].text.strip()) 
    for t in (t.find_all('td') for t in countries[0].find_all('tr'))
    if t
]

countries_list, currency_list = map(list,zip(*temp_list))

完整代码：

from bs4 import BeautifulSoup
import urllib.request

req = urllib.request.Request("http://www.worldatlas.com/aatlas/infopage/currency.htm")

soup = BeautifulSoup(urllib.request.urlopen(req).read(), "html.parser")

countries = soup.find_all("div", attrs = {"class" : "miscTxt"})

temp_list = [
    (t[0].text.strip(), t[1].text.strip()) 
    for t in (t.find_all('td') for t in countries[0].find_all('tr'))
    if t
]

countries_list, currency_list = map(list,zip(*temp_list))

print(countries_list)
print(currency_list)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

webscraping

beautifulsoup

不在网络抓取中迭代列表的相关文章

Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
如何在 Ubuntu 16.04 上的 Python 3 / Matplotlib 2 中安装底图？

I tried pip3 install basemap but Basemap https sourceforge net projects matplotlib files matplotlib toolkits 好像不在 PyPI 上
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
在 pytube3 中获取 youtube 视频的标题？

我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题这是我的代码 from pytube import YouTube yt YouTube link print yt titl
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

用C++读写二进制文件

我对 C 完全陌生昨天开始自学了几个小时所以我有一个未压缩的简单beep wav文件只有大约 3 秒长其中有一声嘟嘟声我最终想要实现的是只是读取文件同时写入二进制数据所有这些包括标题 ftm and data或所有十六进
我如何强制sql server首先执行子查询并过滤“where”语句

我有一个这样的查询 select from select from TableX where col1 2 0 subquery where col1 4 0 实际的子查询更复杂当我单独执行子查询时它可能很快返回 200 行但是当我执
如何在QWidget中实现mouseEnter和mouseLeave事件？

如何在QWidget中实现mouseEnter和mouseLeave事件如果鼠标进入QWidget那么我需要将背景颜色设置为灰色如果 mouseLeave 从 QWidget 那么我需要将背景颜色设置为白色 i tried void e
有什么好的免费工具可以用来调查 Java 中无意的对象保留情况？

我的多线程 Java 程序崩溃了因为它耗尽了堆空间但我认为它不应该崩溃假设罪魁祸首是无意的对象保留那么有什么好的免费工具可以调查哪些对象被无意保留呢我的IDE是Eclipse 以下是您可以查看的开源工具列表 http java s
将 Bower 组件安装到两个不同的目录中？

当使用 CSS 和 JS 组件时是否有可能或者甚至将它们安装到不同的目录是否有意义 app scripts components js components go here backbone amd etc styles module
如何访问 ASP.Net 中的自定义文本框属性？

我正在使用滥用 CSS 类和自定义 html 属性来向一组文本框提供默认数据其代码前端如下所示有一些支持 JavaScript 来处理字段为空时检查设置默认数据
根据 r 中列中的日期计算平均值

我正在尝试根据列中的日期计算平均值可以选择之前的天数例如 4 天获取前 4 条记录减去 StartDate 的平均值并将平均值向下滚动直到出现 EndDate 我正在尝试 tapply df Boe df ShutinDate f
在类型上未找到带有“Autofac.Core.Activators.Reflection.DefaultConstructorFinder”的构造函数

我在 SO 上读过很多关于这个问题的问题但我无法弄清楚我的实现有什么问题我收到以下异常在类型 SampleAuthTemplate Domain Entities Core Repositories Concrete EntityRe
在javascript中逆时针排序点

我在画布上引入了一组点我的画布上有一组点 https i stack imgur com 1dKtD png 我必须将此算法应用于 Algo NoObtuse 以及该算法生成的图表示例 https i stack imgur com 4f
为什么我缺少 Qt 多媒体功能？

我是 Qt 新手正在创建一个简单的应用程序来播放音频文件当我写下以下内容时我意识到我缺少用于音频的 Qt 多媒体 API include
如何在 Bing 地图 Silverlight 中绑定最大和最小缩放级别

我想在我的 silverlight 应用程序中为 Bing 地图控件实现自定义缩放滑块我可以用一种非常简单的方式设置它的机制
此 URL 不支持 HTTP 方法 GET，尽管它执行 doGet [重复]

这个问题在这里已经有答案了 public class RoarHistoryUpdate extends HttpServlet public void doGet HttpServletRequest request HttpServle
jquery 验证日期

在提交表单之前如何验证日期格式我尝试执行以下操作然而它不起作用 p Date br p
IPv6 Socket程序问题

似乎流程没有进入包含 ipv6server c 中接受的 for 循环因此无法接受并与客户端连接有什么错误吗此代码对于 IPV4 工作正常但在 IPV6 更改后出现此问题 ipv6server c include
R在没有管理员权限的情况下将数据帧写入excel

我对 R 完全是个新手所以如果答案是显而易见的请耐心等待我在一台不属于我的笔记本电脑上工作因此除了管理员为我完成的原始安装之外我没有任何管理权限我认为缺乏管理员权限是我无法写入 Excel 文件的原因请参阅下面的示例原始数据
从 Rcpp 返回 NA

我正在尝试通过 Rcpp 返回 NA 我不懂为什么get na 按照这里的建议在这里不起作用post https stackoverflow com a 23745470 6484844 gt Rcpp cppFunction Numeri
在 C 中将动态分配的数组作为参数传递

所以我的主网上有一个动态分配的数组 int main int array int len array int malloc len sizeof int return EXIT SUCCESS 我还想构建一个函数来对这个动态分配的数组执行
jasonp跨域请求“将json包装成回调方法”

我添加了回调使用匿名函数获取请求中的 url 我必须在服务器端代码中添加什么才能使其跨域工作这里使用getJSON是否正确这是没有 JSONP 的播放器的示例http www freeenergymedia com shared P
将变量从 Scala 中的存在类型 TypeCast 转换为运行时类型

这个线程 https stackoverflow com questions 29380839 trait runtime type of type parameter through typetag when used with exis
不在网络抓取中迭代列表

通过链接我尝试创建两个列表一个用于国家地区另一个用于货币但是我陷入了困境它只给了我第一个国家地区名称但没有迭代到所有国家地区的列表任何有关如何解决此问题的帮助将不胜感激提前致谢这是我的尝试 from bs4 imp

不在网络抓取中迭代列表

不在网络抓取中迭代列表 的相关文章

随机推荐

热门标签

不在网络抓取中迭代列表的相关文章