pandas“未命名”列不断出现

2024-01-06

我遇到一个问题,每次运行程序(从 .csv 文件读取数据帧)时,都会显示一个名为“未命名”的新列。

运行 3 次后的示例输出列 -

  Unnamed: 0  Unnamed: 0.1            Subreddit  Appearances

这是我的代码。对于每一行,“未命名”列仅增加 1。

df = pd.read_csv(Location)
while counter < 50:
    #gets just the subreddit name
    e = str(elem[counter].get_attribute("href"))
    e = e.replace("https://www.reddit.com/r/", "")
    e = e[:-1]
    if e in df['Subreddit'].values:
        #adds 1 to Appearances if the subreddit is already in the DF
        df.loc[df['Subreddit'] == e, 'Appearances'] += 1
    else:
        #adds new row with the subreddit name and sets the amount of appearances to 1.
        df = df.append({'Subreddit': e, 'Appearances': 1}, ignore_index=True)
    df.reset_index(inplace=True, drop=True)
    print(e)
    counter = counter + 2
#(doesn't work) df.drop(df.columns[df.columns.str.contains('Unnamed', case=False)], axis=1)

我第一次使用干净的 .csv 文件运行它时,它运行得很好,但每次之后,都会出现另一个“未命名”列。 我只是希望每次都能显示“Subreddit”和“Appearances”栏。


另一种解决方案是使用属性读取 csvindex_col=0不考虑索引列:df = pd.read_csv(Location, index_col=0).

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

pandas“未命名”列不断出现 的相关文章

  • 多处理中的动态池大小?

    有没有办法动态调整multiprocessing Pool尺寸 我正在编写一个简单的服务器进程 它会产生工作人员来处理新任务 使用multiprocessing Process对于这种情况可能更适合 因为工作人员的数量不应该是固定的 但我需
  • 反编译Python 3.9.2的PYC文件[重复]

    这个问题在这里已经有答案了 目前 我有一个 3 9 2 版本的 python 的 PYC 文件 P S 这适用于所有 3 9 及更高版本 我正在尝试反编译 PYC 文件 但它显示错误 因为 uncompyle6 或者更确切地说 新版本 de
  • 是否可以从 Julia 调用 Python 函数并返回其结果?

    我正在使用 Python 从网络上抓取数据 我想使用这些数据在 Julia 中运行计算 是否可以在 Julia 中调用该函数并返回其结果 或者我最好直接导出到 CSV 并以这种方式加载数据 绝对地 看PyCall jl https gith
  • 使用 Boto3 以字符串形式打开 S3 对象

    我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
  • 创建上下文后将 jar 文件添加到 pyspark

    我正在笔记本上使用 pyspark 并且不处理 SparkSession 的创建 我需要加载一个包含一些我想在处理 rdd 时使用的函数的 jar 您可以使用 jars 轻松完成此操作 但在我的特定情况下我无法做到这一点 有没有办法访问sp
  • 使用 Paramiko 进行 DSA 密钥转发?

    我正在使用 Paramiko 在远程服务器上执行 bash 脚本 在其中一些脚本中 存在与其他服务器的 ssh 连接 如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用 以连接
  • 协程从未被等待

    我正在使用一个简单的上下文管理器 其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
  • 如何确保 re.findall() 停止在正确的位置?

    这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
  • 运行 Python 单元测试,以便成功时不打印任何内容,失败时仅打印 AssertionError()

    我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具 它将作为命令行
  • Python将文本文件解析为嵌套字典

    考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进
  • Paste.httpserver 并通过 HTTP/1.1 Keep-alive 减慢速度;使用 httperf 和 ab 进行测试

    我有一个基于paste httpserver 的Web 服务器作为HTTP 和WSGI 之间的适配器 当我使用 httperf 进行性能测量时 如果每次使用 num conn 启动一个新请求 我每秒可以执行超过 1 000 个请求 如果我使
  • 使用 for 循环创建一系列元组

    我已经搜索过 但找不到答案 尽管我确信它已经存在了 我对 python 很陌生 但我以前用其他语言做过这种事情 我正在以行形式读取数据文件 我想将每行数据存储在它自己的元组中 以便在 for 循环之外访问 tup i inLine wher
  • python中basestring和types.StringType之间的区别?

    有什么区别 isinstance foo types StringType and isinstance foo basestring 对于Python2 basestring是两者的基类str and unicode while type
  • 从 Flask 运行 NPM 构建

    我有一个 React 前端 我想在与我的 python 后端 API 相同的源上提供服务 我正在尝试使用 Flask 来实现此目的 但我遇到了 Flask 找不到我的静态文件的问题 我的前端构建是用生成的npm run build in s
  • pandas 相当于 np.where

    np where具有向量化 if else 的语义 类似于 Apache Spark 的when otherwise数据帧方法 我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
  • 如何查找或安装适用于 Python 的主题 tkinter ttk

    过去 3 个月我一直在制作一个机器人 仅用代码就可以完美运行 现在我的下一个目标是为它制作一个 GUI 但是我发现了一些障碍 主要的一个是能够看起来不像一个 30 年前的程序 我使用的是 Windows 7 我仅使用 Python 3 3
  • Airflow 1.9 - 无法将日志写入 s3

    我在 aws 的 kubernetes 中运行气流 1 9 我希望将日志发送到 s3 因为气流容器本身的寿命并不长 我已经阅读了描述该过程的各种线程和文档 但我仍然无法让它工作 首先是一个测试 向我证明 s3 配置和权限是有效的 这是在我们
  • Django 管理器链接

    我想知道是否有可能 如果可以的话 如何 将多个管理器链接在一起以生成受两个单独管理器影响的查询集 我将解释我正在研究的具体示例 我有多个抽象模型类 用于为其他模型提供小型的特定功能 其中两个模型是DeleteMixin 和GlobalMix
  • 定义在文本小部件中双击时选择哪些字符

    在 Windows 上 双击文本小部件中的单词也将选择连接的标点符号 有什么方法可以定义您想要选择的角色吗 tcl wordchars该变量的值是一个正则表达式 可以设置它来控制什么被视为 单词 字符 例如 通过双击 Tk 中的文本来选择单
  • 无法安装最新版本的 Numpy (1.22.3)

    我正在尝试安装最新版本的 numpy 即 1 22 3 但看起来 pip 无法找到最后一个版本 我知道我可以从源代码本地安装它 但我想了解为什么我无法使用 pip 安装它 PS 我有最新版本的pip 22 0 4 ERROR Could n

随机推荐

  • FIDO U2F 令牌 Web 浏览器兼容性

    我正在尝试整合U2FGWT 项目中的身份验证 我需要知道该解决方案是否兼容all新的网络浏览器 Firefox Internet Explorer Safari 通常在 Google Chrome 中我必须安装一个名为 FIDO U2F 通
  • 如何找出分支中哪些文件已被修改?

    我有两个分支 master 和 bug1 我检查了 bug1 做了很多更改和多次提交 如何获取分支上更改的所有文件的列表 我对哈希值 日期或任何其他提交相关的细节不感兴趣 我只想获得一个简单的触摸文件列表 git diff name onl
  • sizeof(MPI_INT) 与 sizeof(int) 不同

    我注意到 int 和 double 的大小与使用函数 MPI Type size MPI INT MPI INT SIZE 计算的大小不同 这是否意味着 sizeof MPI INT 返回错误值 8 通常应该是 4 感谢您的回复 MPI I
  • org.slf4j.helpers.NOPLoggerFactory 无法转换为 ch.qos.logback.classic.LoggerContext

    当我在maven m2e 中使用logback时 出现以下错误 环境 JBOSS 7 1 1 maven eclipse 但如果我只是作为主类单独运行 它就可以正常工作 我无法弄清楚为什么会出现此错误 任何人都可以帮助我解决此问题并找到解决
  • Composer 更新 => 致命错误:内存不足

    我在本地计算机上使用 XAMPP 我无法通过删除 PHP 内存限制来解决这个问题 我已经尝试过的 修改我的 php ini 以删除内存限制 gt 内存限制 1 检查我正在运行 PHP 5 6 并自行更新composer到最新版本 但似乎根本
  • 如何将源文件添加到另一个文件夹中

    我正在使用 cmake 在 C 中构建我的项目 假设我的源文件夹中有以下目录 Source Dir1 Class cpp Class hpp Dir2 Main cpp 在 Dir1 中有一个类及其头文件和实现文件 Class cpp 和
  • ContentEditable 上可靠的跨浏览器信息

    我正在寻找完全支持使用 ContentEditable 的 Web 浏览器列表 我知道IE从5或5 5开始就支持它 但是其他浏览器呢 我知道 Chrome Flock Maxthon Opera 和 I E 的现代版本都支持它 但我不关心现
  • 加载 DB2 JDBC 驱动程序时出现 java.lang.UnsatisfiedLinkError

    我尝试将jboss seam与db2数据库一起使用 出现以下错误 com ibm db2 jcc a SqlException jcc 10389 12245 3 52 95 while loading the native library
  • 在Python中,是否有async相当于multiprocessing或concurrent.futures?

    基本上 我正在寻找使用 python3 协程作为后端而不是线程或进程提供并行映射的东西 我相信执行高度并行 IO 工作时应该有更少的开销 当然类似的东西已经存在了 无论是在标准库中还是在一些广泛使用的包中 免责声明 PEP 0492 htt
  • 使用 Typescript 设置 Vue 数据对象中的数据类型

    我目前正在 webpack 项目中使用 Vue js 和 Typescript 如中所示推荐配置 https v2 vuejs org v2 guide typescript html in my tsconfig json I have
  • 将字符串转换为 LatLng

    我正在使用 Google Maps API v2 并且从 SharedPreferences 中获取位置坐标单个字符串 34 8799074 174 7565664 我需要将其转换为 LatLng 有人可以帮忙吗 Thx 谷歌地图Andro
  • Caliburn.Micro 将 MainView 中的 UserControls 绑定到其 ViewModel

    我有一个 MainView xaml 绑定到 MainViewModel 就可以了 我想尝试的是将主窗体上的许多控件拆分为用户控件 现在 我将 UserControls 与 MainView 一起放入 Views 文件夹中 并将它们命名为
  • 我在 KubernetesPodOperator 的 DAG 设置中做错了什么

    我在这个中找到了以下Airflow DAG博客文章 https kubernetes io blog 2018 06 28 airflow on kubernetes part 1 a different kind of operator
  • Spritekit - 创建一堵“墙”

    我想知道如何用 spritekit 创建一堵墙 物体上的某些东西无法移动过去 我知道我可以使用这段代码 self physicsBody SKPhysicsBody bodyWithEdgeLoopFromRect self frame 但
  • JavaScript 对象检测:点语法与“in”关键字

    我见过两种检测 UA 是否实现特定 JS 属性的方法 if object property and if property in object 我想听听关于哪个更好的意见 最重要的是 为什么 其中一个明显优于另一个吗 除了这两种方法之外还有
  • 获取CPU温度

    我想知道CPU的温度 以下是我使用 C 和 WMI 所做的工作 我正在读取 MSAcpi ThermalZoneTemperature 但它始终相同 而且根本不是 CPU 温度 有没有办法不用写驱动就能获取CPU的真实温度 或者有什么我可以
  • OpenXML SDK C++ 示例

    HI 我正在尝试使用 OpenXML SDK 在 C 中创建一个 Word 文档 我在添加引用和使用命名空间时遇到问题 因为网上的大多数示例都是基于 C 给出的 1 如何在代码中添加对项目的引用并使用命名空间 例如 using namesp
  • 邮政信箱验证

    希望验证邮政信箱 但想知道是否存在此类验证 我将 地址 字段分为 地址 1 和 地址 2 此类 PO Apt Suite 信息所在的位置 Example Address 1 123 Main Street Address 2 Suite 1
  • Hadoop MapReduce 出现“无法解析主机名”错误

    现在我运行Hadoop MapReduce作业 输入数据来自HBase表 最近出现错误 错误如下 错误mapreduce TableInputFormatBase 无法解析 172 16 4 195的主机名 因为javax naming N
  • pandas“未命名”列不断出现

    我遇到一个问题 每次运行程序 从 csv 文件读取数据帧 时 都会显示一个名为 未命名 的新列 运行 3 次后的示例输出列 Unnamed 0 Unnamed 0 1 Subreddit Appearances 这是我的代码 对于每一行 未