从列表中删除重复的项目

2023-12-11

我尝试跟随这个帖子但是,它似乎对我不起作用。

我尝试了这段代码:

for bresult in response.css(LIST_SELECTOR):
    NAME_SELECTOR = 'h2 a ::attr(href)'
    yield {
        'name': bresult.css(NAME_SELECTOR).extract_first(),
    }
                                                                                  b_result_list.append(bresult.css(NAME_SELECTOR).extract_first())

    #set b_result_list to SET to remove dups, then change back to LIST
    set(b_result_list)
    list(set(b_result_list))
for brl in b_result_list:
    print("brl: {}".format(brl))

这打印出:

brl: https://facebook.site.com/users/login
brl: https://facebook.site.com/users
brl: https://facebook.site.com/users/login

当我只需要:

brl: https://facebook.site.com/users/login
brl: https://facebook.site.com/users

我在这里做错了什么?

谢谢你!


当您需要保存结果时,您正在丢弃它......b_result_list实际上从未改变......所以你只是迭代原始列表。而是保存结果set手术

b_result_list = list(set(b_result_list))

(注意sets 不保留顺序)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从列表中删除重复的项目 的相关文章

  • Python:访问另一个类中一个类的属性和方法

    假设我有两个 A 类和 B 类 Class A A s attributes and methods here Class B B s attributes and methods here 现在我可以评估 B 类对象中 A 的属性 如下所
  • 使用 setuptools (pip) 时如何打印警告和错误

    我正在使用 setuptools 来打包代码 以便可以使用以下命令轻松安装它 cd project name pip install 在设置过程中 我想警告用户有关预先存在的配置文件的信息 并在系统上打印一些安装后说明 例如 etc pro
  • Python TypeError:不支持的操作数类型 -:“int”和“function”

    我是 Python 初学者 正在做一项作业 我不断得到TypeError unsupported operand type s for int and function 即使在研究了错误并应用了建议的修复之后 我并不是在寻找任何人给我一个解
  • 获取父类名? [复制]

    这个问题在这里已经有答案了 class A object def get class self return self class class B A def init self A init self b B print b get cl
  • Django CollectStatic 启动大文件上传时管道损坏

    我正在尝试使用collectstatic将静态文件上传到我的S3存储桶 但我收到一个700k javascript文件的管道损坏错误 这就是错误 Copying Users wedonia work asociados server aso
  • 如何在 dash/plotly 中使用 iframe? (Python/HTML)

    我正在创建一个仪表板 我想使用这个交互式地图 网站链接 https www ons gov uk peoplepopulationandcommunity healthandsocialcare causesofdeath articles
  • 使用 pytherejs 嵌入小部件:错误的视角和相机观察

    我在用pythreejs可视化一些 3D 模型 在 Jupyter 笔记本上可视化模型时 一切都按预期进行 但是当尝试将小部件嵌入 HTML 文档时 我面临两个问题 看起来相机在加载时正在查看 0 0 0 而不是预期的那样 一旦您与小部件交
  • Plotly:如何在堆叠条形图顶部显示值的总和以及各个条形值?

    我正在尝试在 Python 中的 Plotly Express 中添加每个堆叠条形顶部的总计以及各个条形值 import plotly express as px df px data medals long fig px bar df x
  • 将 postgres 连接到 django 时遇到问题

    以下文档来自Django Postgres 文档 https docs djangoproject com en 4 1 ref databases postgresql notes我添加到我的settings py 在我设置的设置中 DA
  • [Python]比较两个 zip 文件的函数,一个位于 FTP 目录中,另一个位于我的本地计算机上

    我在创建比较两个 zip 文件的函数时遇到问题 如果它们相同 而不仅仅是名称相同 这是我的代码示例 def validate zip files self host 192 168 0 1 port 2323 username 123 pa
  • Python父类访问子私有变量

    以下代码会生成错误 class A object def say something self print self foo print self bar class B A def init self self foo hello sel
  • Python - 从一定范围内随机采样,同时避免某些值

    我一直在阅读有关random sample 函数在random模块 但没有看到任何可以解决我的问题的东西 我知道使用random sample range 1 100 5 会给我来自 人群 的 5 个独特样本 我想得到一个随机数range
  • 抓取 Shopee API v4

    我有一个最终项目 其中我想要检索的数据是通过在shopee上抓取数据来获取的 但是当我在隐藏的API上抓取shopee时遇到问题 当我在Insomnia脚本上尝试时 脚本会运行 但是当我尝试时在本地或 google colab 脚本上 这是
  • 从Python列表中挑选出具有特定索引的项目

    我确信在 Python 中有一种很好的方法可以做到这一点 但我对这门语言还很陌生 所以如果这是一个简单的方法 请原谅我 我有一个列表 我想从该列表中挑选某些值 我想要挑选的值是列表中索引在另一个列表中指定的值 例如 indexes 2 4
  • Python pandas:向我的数据框中添加一列来计算变量

    我有一个像这样的数据框 gt org group org1 1 org2 1 org3 2 org4 3 org5 3 org6 3 我想将列 count 添加到 gt 数据帧以计算组的成员数量 预期结果如下 org group count
  • Maya python 连接选择的属性

    我一直在尝试制作一个简单的脚本 它将采用两个视口选择 然后基本上将第二个视口的旋转连接到第一个 我不确定如何正确地从视口选择中为对象创建变量 这是我的尝试 但不起作用 import maya cmds as cmds sel cmds ls
  • print() 函数的有趣/奇怪的机制

    我正在学习Python 我目前正在学习如何定义自己的函数 并且在尝试理解返回值和打印它之间的区别时遇到了一些困难 我读到的关于这个主题的描述对我来说不太清楚 所以我开始自己尝试 我想我现在已经明白了 如果我没记错的话 区别在于你可以传递 a
  • 合并共享属性的节点

    EDITED 我真的需要 Networkx graph 专家的帮助 假设我有以下数据框 我想将这些数据框转换为图表 然后我想根据描述和优先级属性将两个图映射到相应的节点 df1 From description To priority 10
  • 将音频添加到 OpenCV 生成的视频中

    我一直在使用python下的OpenCV http opencv willowgarage com documentation python index html从捕获设备录制视频 每小时写入两个输出 AVI 每小时开始时文件名都会更改 其
  • 限制 Python 上每秒的 HTTP 请求数

    我编写了一个脚本 用于从文件中获取 URL 并同时向所有 URL 发送 HTTP 请求 我现在想限制每秒 HTTP 请求数和每个接口的带宽 eth0 eth1等 在会话中 有什么办法可以在Python上实现这一点吗 您可以使用 Semaph

随机推荐

  • 如何使用带有 SQL-Server 负载的显式连接表添加 Entity Framework Core n-m 自引用实体?

    我想使用 NET 6 创建一个简单的市场模拟 为此 我想将产品存储在 SQL Server 数据库中 每个产品都可以由其他产品组成 作为构建它的材料 仅用于命名说明 基本材料产品没有作为材料的产品 因此materials list可以为空
  • 如何使用 dplyr 通过非标准评估来评估构造的字符串?

    我读过几本关于编程的指南dplyr现在我仍然对如何解决使用非标准评估 NSE 评估构造 连接字符串的问题感到困惑 我意识到有比使用 NSE 更好的方法来解决这个例子 但我想学习如何做 t lt tibble x 01 c 1 2 3 x 0
  • Android HttpEntityUtils OutOfMemoryException

    我正在开发一个连接到网络服务器并接收二进制数据的项目 我的问题是当我从网络服务器下载数据时 如果我发送登录请求或激活某些设置 则没有问题 但是当我发送下载二进制数据的请求时 它给了我一个OutOfMemoryException 这是我正在使
  • UML 用例:列表与图表

    我对正在读的一本书感到困惑 我一直认为用例是某种带有演员和气泡的图表 就像来自维基百科的这个 But in Head First 面向对象分析和设计 O Reilly 所谓的 用例 只是包含主要 快乐路径和备用路径的列表 O Reilly
  • SQL 不接受 PowerShell 日期格式

    我遇到了一个奇怪的问题 当服务器的Region and Language设置被设置为English United States 包含日期和时间的对象没有问题 但是当我将其更改为我的国家本地时Dutch Belgium 我的一些 PowerS
  • 如何将 HTML 字符引用 (ף) 转换为常规 UTF-8?

    我有一些希伯来语网站 其中包含字符引用 例如 x5E0 x5D5 x5E3 仅当我将文件另存为 html 并以 UTF 8 编码查看时 我才能查看这些字母 如果我尝试将其作为常规文本文件打开 则 UTF 8 编码不会显示正确的输出 我注意到
  • 为什么我不应该使用 HTML 框架? [关闭]

    Closed 这个问题是基于意见的 目前不接受答案 自 1998 年以来 我就没有使用过框架 它们似乎是一个坏主意 在我的所有开发过程中 我从未遇到过框架是正确的解决方案 甚至是一个不错的解决方案的情况 但是 我现在正在使用另一个小组编写的
  • 选择父母的兄弟姐妹

    我有这个 HTML font b a href profile user user a b font message font font 我知道字体标签很糟糕 但他们想要字体标签 所以我添加了字体标签 我可以选择用户名 a href use
  • 选择 QR 码的字符编码

    我正在构建一个应用程序 它将能够生成包括任意文本数据的二维码 然而 这提出了一个挑战 我希望用户包含非 ASCII 字符 例如 或 根据我收集到的信息 QR 码的默认值是 ISO 8859 1 但 UTF 8 似乎是常见的选择 并且接受更广
  • Railscast 198,但使用 formattastic

    你怎么能做其中所涵盖的事情RyanB 的 Railscast使用 Formtastic 单独编辑多个记录 Formtastic 不使用 RyanB 的方法所依赖的 form tag The semantic form for只是一个包装fo
  • 杂货店 CRUD 中的调试

    如何调试我的回调脚本 我有一个 deal management 函数 可以执行杂货 CRUD 我有一个 callback after insert array this insert coupon codes 因为数据库中的插入在我的函数中
  • Xcode 6.3.2 无法构建或运行项目

    升级到 Xcode 6 3 2 后 我无法构建 运行 分析 配置项目 甚至项目清理功能看起来也被破坏了 有没有人遇到过类似的问题并知道如何解决 当您下载并安装 6 3 2 的新命令行工具时 问题似乎就消失了
  • 如何在立方体上获得平坦的法线

    我使用的 OpenGL 没有已弃用的功能 并且我的光照计算是在片段着色器上完成的 所以 我正在做平滑着色 我的问题是 当我绘制立方体时 我需要平坦的法线 通过平坦法线 我的意思是在面上生成的每个片段都具有相同的法线 到目前为止 我的解决方案
  • 如何在 R 中绘制二次回归?

    以下代码在 R 中生成二次回归 lm out3 lm listOfDataFrames1 avgTime listOfDataFrames1 betaexit I listOfDataFrames1 betaexit 2 I listOfD
  • XSLT + 创建表结构

    我想创建一个表结构 将标题行分隔开THEAD和数据行TBODY 输入 XML
  • VirtualMode 中的 WinForms ListView 是否限制为 100,000,000 行?

    我有一些网格场景 我想显示 gt 500 000 000 行 在列表视图中 如果我人为地限制我的ListView显示100 000 000 listView VirtualListSize data Count if listView Vi
  • css 类来淡化背景颜色

    我需要一个类来减轻元素背景颜色而不在类中指定颜色 当我对颜色进行硬编码时 这很容易 lighten background color lighten blue 30 但是 如何在不影响内容颜色的情况下将淡化应用于元素的任何颜色 div cl
  • 获取脚本父元素的引用

    我正在使用 AJAX 返回包含脚本的响应 通过该脚本 如何确定脚本正在运行的父元素的 ID 而不将 id 传递给服务器 有办法吗 Thanks 如果您为脚本分配一个 ID 这会在古老的浏览器中爆炸 你可以试试 var id idOfTheS
  • 有没有办法查询特定类型的具有意图过滤功能的应用程序?

    我正在寻找一种方法来在设备中搜索所有能够通过操作 查看 和类别 可浏览 来过滤意图的应用程序 我找到了以下链接并学习了如何列出所有意图过滤器 但是如何仅列出那些仅具有上述参数的意图过滤器 http developer android com
  • 从列表中删除重复的项目

    我尝试跟随这个帖子但是 它似乎对我不起作用 我尝试了这段代码 for bresult in response css LIST SELECTOR NAME SELECTOR h2 a attr href yield name bresult