从Python中的循环输出中删除重复的结果

2024-01-12

我的循环数据生成一系列字符串,这些字符串是从数据库检索的句子。但是,我在数据库中的数据结构需要有重复项,但我想在输出中忽略重复项。假设我的循环和结果如下:

for text in document:
   print(text)

Output:

He goes to school.
He works here.
we are friends.
He goes to school.
they are leaving us alone.
..........

我如何设置一个条件,以便程序读取生成的所有输出,并且如果找到重复的结果(例如,他去上学),它只会向我显示一条记录,而不是多个类似的记录?


already_printed = set()
for text in document:
   if text not in already_printed:
       print(text)
       already_printed.add(text)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从Python中的循环输出中删除重复的结果 的相关文章

  • 如何使用 cython 编译扩展?

    我正在尝试从示例页面编译一个简单的 cython 扩展here http docs cython org src userguide tutorial html在我安装了 Python 2 6 64 位版本的 Windows 7 64 位计
  • 在 Pandas 中按日期获取有效合约

    我在检测 pandas DataFrame 中的活动合约方面遇到了一些困难 假设每一行都是一个协商 对于每一行 我有两列 initial date 和 end date 我想知道的是按日期划分的活跃合约数量 到目前为止我做了一个非常低效的方
  • 从正在运行的 python 脚本检测优化标志是否为 -O 或 -OO

    有时我想生成一个子进程 其优化标志与启动父进程时使用的优 化标志相同 我可以使用类似的东西 optimize not debug 但这样我就可以匹配两者 O and OO flags 是否有一些 python 内部状态包含该信息 经过一番深
  • 为什么 .setGeometry() 不改变 QWidget 实例的大小?

    我想使用 QWidget 更改 QPushButton 的大小 setGeometry https doc qt io qtforpython 5 PySide2 QtWidgets QWidget html PySide2 QtWidge
  • Tensorflow 可变图像输入大小(自动编码器、放大......)

    Edit WARNING不建议使用不同图像大小的图像 因为张量需要具有相同的大小才能实现并行化 我一直在寻找解决方案 了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而 由于每个图像的大小不同 我无法
  • Pandas重置索引未生效[重复]

    这个问题在这里已经有答案了 我不确定我在哪里误入歧途 但我似乎无法重置数据帧上的索引 当我跑步时test head 我得到以下输出 正如您所看到的 数据帧是一个切片 因此索引超出范围 我想做的是重置该数据帧的索引 所以我跑test rese
  • 如果字段值在外部列表中,Django 会注释布尔值

    想象一下我有这个 Django 模型 class Letter models Model name models CharField max length 1 unique True 还有这个列表 vowels a e i o u 我想查询
  • sudo pip install python-Levenshtein 失败,错误代码 1

    我正在尝试在 Linux 上安装 python Levenshtein 库 但每当我尝试通过以下方式安装它时 sudo pip install python Levenshtein 我收到此错误 命令 usr bin python c 导入
  • 定义函数后对其进行修饰?

    I think答案是否定的 但我似乎找不到明确的说法 我有以下情况 def decorated function function functools wraps function def my function print Hello s
  • 如何使用 python urllib 在 HTTP/1.1 中保持活力

    现在我正在这样做 Python3 urllib url someurl headers HOST somehost Connection keep alive Accept Encoding gzip deflate opener urll
  • 如何通过双击在浏览器中打开 ipynb 文件

    以前 我安装了 Canopy 当时 我只需双击 ipynb 文件并在浏览器中打开它们即可 但是 后来我需要Anaconda 一旦我安装了它 这个功能就没有了 现在我只希望能够简单地双击 ipynb 文件 然后该文件就会在 Firefox 中
  • matplotlib matshow 标签

    我一个月前开始使用 matplotlib 所以我仍在学习 我正在尝试用 matshow 制作热图 我的代码如下 data numpy array a reshape 4 4 cax ax matshow data interpolation
  • 如何使用Python的super()来更新父值?

    我对继承很陌生 之前所有关于继承和 Python 的 super 函数的讨论都有点超出我的理解 我当前使用以下代码来更新父对象的值 usr bin env python test py class Master object mydata
  • Python:计算数据帧列中所有行中特定字符的实例数

    我有一个包含列 toaddress ccaddress body 的数据框 df 我想迭代数据帧的索引 以获取 toaddress 和 ccaddress 字段中电子邮件地址的最小 最大和平均数量 这是通过计算这两列中每个字段中的 和 的实
  • Python 中的 @staticmethod 与 @classmethod

    方法和方法有什么区别装饰的 https peps python org pep 0318 with staticmethod http docs python org library functions html staticmethod和
  • 无法截取宽度为 0 的屏幕截图

    我正在尝试截取 Bootstrap 模态内元素的屏幕截图 经过一番努力 我终于想出了这段代码 driver get https enlinea sunedu gob pe driver find element by xpath div c
  • conda-env list / conda info --envs 如何查找环境?

    我一直在尝试 anaconda miniconda 因为我的用户使用随 miniconda 安装的结构生物学程序 并且作者都没有 A 考虑到可能存在其他 miniconda 应用程序 B 他们的程序将在多用户环境中使用 因此 使用 Arch
  • 导入错误:没有名为 google.auth 的模块

    当我尝试导入时firebase admin in python 2 7我收到错误 导入错误 没有名为 google auth 的模块 这是Docker文件 https github com ammaratef45 Attendance bl
  • Scipy 稀疏 Cumsum

    假设我有一个scipy sparse csr matrix代表下面的值 0 0 1 2 0 3 0 4 1 0 0 2 0 3 4 0 我想就地计算非零值的累积和 这会将数组更改为 0 0 1 3 0 6 0 10 1 0 0 3 0 6
  • 如何将列表字典写入字符串而不是 CSV 文件?

    This 堆栈溢出问题 https stackoverflow com questions 37997085 how to write a dictionary of lists to a csv file将列表字典写入 CSV 文件的答案

随机推荐

  • Java JTextArea KeyListener

    当我按下 ENTER 时 我的 JTextArea 开始一个新行 我只想对 doClick 方法执行其他操作 我该怎么做呢 textarea addKeyListener new KeyListener Override public vo
  • 在 AWS CloudFront 上启用 POST/PUT/DELETE?

    在 AWS CloudFront 中 我在 默认缓存行为设置 区域中的 允许的 HTTP 方法 中进行了设置 GET HEAD OPTIONS PUT POST PATCH DELETE 我的 CloudFront 链接到 AWS S3 存
  • 带有 .htaccess 的 HTTP 缓存标头

    我正在尝试配置我的 htaccess 文件来设置缓存时间 尝试了所有可能的配置 但没有任何效果 这是我的 HTML 中写的内容 这是我的 htaccess 文件中写入的内容 ExpiresActive On ExpiresDefault A
  • Python:从列表中删除奇数

    我编写了一个函数来从列表中删除奇数 如下所示 def remove odd l for i in l if i 2 0 l remove i print l return l remove odd 4 5 4 remove odd 4 5
  • 在 java(w).exe 进程列表中查找 .jar 的名称

    在我的公司环境中 这个脚本在大量计算机上运行 我偶尔会要求用户杀死该脚本 因为众所周知它有时会锁定 我正在想办法自己杀死它 我注意到我可以使用远程列出pslist然后使用杀死它pskill 现在的问题是 当有人运行多个 java 应用程序
  • 转换为自动引用计数 (ARC):“使用未声明的标识符”错误

    在一个非常大的项目中 我到处都使用了自动合成的属性 MyClass h file interface MyClass NSObject property nonatomic retain NSString deviceName proper
  • 如何直接从 UIWebView 将登录信息传递到网站而不需要再次登录?

    我想使用 UIWebView 在我的 iPhone 应用程序中打开一些网站 该网站需要用户名和密码 我有这些用户名和密码 我想知道是否可以在 UIWebView 中打开网站而无需任何登录屏幕 我的意思是 因为我已经有了用户名和密码 我可以使
  • 如何防止 Java 中出现 403 HTTP 错误代码?

    我使用简单的代码来获取htmlhttp www ip adress com http www ip adress com 但它显示错误http代码403 我在其他网站 例如google com 的程序中尝试过 它可以工作 我也可以在浏览器中
  • 如何使用 R formattable 包更改表标题行的外观

    我正在使用 R 中的 formattable 包来生成 HTML 表 我可以使用格式化程序来自定义表中数据值的外观 例如字体大小 颜色等 但我不知道如何更改表标题行的外观 我可以使用 col names 更改实际的列名称 但无法更改它们的外
  • 在java中获取模式值

    有人知道如何从数组中获取模式值吗 例如 如果我有一个数字不同的数组 我如何使用Java来查找出现次数最多的数字 完成时间为 O n 而不是 O n 2 需要长度 gt 0 的数组 public static int getMode int
  • 在 GDB 中创建 C++ 字符串

    我在创建时遇到问题std string 或者任何 C 对象 我猜 在 GDB 中 我尝试了以下多种变体 但似乎都不起作用 gdb p std string hello A syntax error in expression near he
  • 迭代 json 对象来绘制柱形图?

    I use google load visualization 1 packages columnchart google setOnLoadCallback drawChart function drawChart response al
  • NodeJS 中用于 API 的存根 DynamoDB

    我在存根 DynamoDB 调用以进行 API 测试时遇到问题 我正在使用无服务器摩卡 想要从端到端的角度测试我的 API 项目结构并不简单 但在 API 文件本身内部 我对不同的类文件进行了单独的调用 以实际使用 DynamoDB 函数
  • malloc: *** 对象错误: 未分配被释放的指针 *** 在 malloc_error_break 中设置断点进行调试

    有人可以帮我弄清楚我在哪里收到此错误吗 我知道这可能是双重删除或类似的事情 对于背景 这是霍夫曼树的实现 您可以轻松地实现维基百科 http en wikipedia org wiki Huffman coding CharCountNod
  • 仅在底部 UIView 上设置阴影

    我想在 UIView 上创建仅底部的阴影 现在使用此功能 将在顶部 底部 左侧和右侧创建阴影 func setCardView view UIView view layer masksToBounds false view layer sh
  • 动画后如何保持样式? [复制]

    这个问题在这里已经有答案了 我正在制作一个作品集 以便在我申请下一次学习时展示 由于我们生活在 2012 年 它有大量精美的动画和 CSS3 垃圾 只是为了给他们 我们需要这个家伙 的感觉 我现在遇到一个小问题 这是特定元素的一小部分 Th
  • System.InvalidOperationException:Android 上全局不支持 PushAsync

    我正在关注这个 Xamarin Forms快速入门指南 https developer xamarin com guides xamarin forms getting started hello xamarin forms multisc
  • 1052: 字段列表中的列“id”不明确

    我有2张桌子 tbl names and tbl section它同时具有id场在他们之中 我该如何选择id字段 因为我总是收到此错误 1052 Column id in field list is ambiguous 这是我的查询 SEL
  • 在模板类中实现 >> 和 << 运算符的重载

    我正在尝试编写函数定义 以在类定义之外重载运算符 gt gt 和 1 gt Source obj error LNK2019 unresolved external symbol class std basic istream
  • 从Python中的循环输出中删除重复的结果

    我的循环数据生成一系列字符串 这些字符串是从数据库检索的句子 但是 我在数据库中的数据结构需要有重复项 但我想在输出中忽略重复项 假设我的循环和结果如下 for text in document print text Output He g