TypeError：不支持的操作数类型 -：python 3.x Anaconda 中的“str”和“str”

2024-01-08

我正在尝试在大型数据集中每小时计算一些实例。下面的代码似乎在 python 2.7 上运行良好，但我必须将其升级到 3.x 最新版本的 python，并在 Anaconda 上更新所有包。当我尝试执行该程序时，我正在跟踪str error

Code:

import pandas as pd
from datetime import datetime,time
import numpy as np

fn = r'00_input.csv'
cols = ['UserId', 'UserMAC', 'HotspotID', 'StartTime', 'StopTime']
df = pd.read_csv(fn, header=None, names=cols)

df['m'] = df.StopTime + df.StartTime
df['d'] = df.StopTime - df.StartTime

# 'start' and 'end' for the reporting DF: `r`
# which will contain equal intervals (1 hour in this case)
start = pd.to_datetime(df.StartTime.min(), unit='s').date()
end = pd.to_datetime(df.StopTime.max(), unit='s').date() + pd.Timedelta(days=1)

# building reporting DF: `r`
freq = '1H'  # 1 Hour frequency
idx = pd.date_range(start, end, freq=freq)
r = pd.DataFrame(index=idx)
r['start'] = (r.index - pd.datetime(1970,1,1)).total_seconds().astype(np.int64)

# 1 hour in seconds, minus one second (so that we will not count it twice)
interval = 60*60 - 1

r['LogCount'] = 0
r['UniqueIDCount'] = 0

for i, row in r.iterrows():
        # intervals overlap test
        # https://en.wikipedia.org/wiki/Interval_tree#Overlap_test
        # i've slightly simplified the calculations of m and d
        # by getting rid of division by 2,
        # because it can be done eliminating common terms
    u = df[np.abs(df.m - 2*row.start - interval) < df.d + interval].UserID
    r.ix[i, ['LogCount', 'UniqueIDCount']] = [len(u), u.nunique()]

r['Date'] = pd.to_datetime(r.start, unit='s').dt.date
r['Day'] = pd.to_datetime(r.start, unit='s').dt.weekday_name.str[:3]
r['StartTime'] = pd.to_datetime(r.start, unit='s').dt.time
r['EndTime'] = pd.to_datetime(r.start + interval + 1, unit='s').dt.time

#r.to_csv('results.csv', index=False)
#print(r[r.LogCount > 0])
#print (r['StartTime'], r['EndTime'], r['Day'], r['LogCount'], r['UniqueIDCount'])

rout =  r[['Date', 'StartTime', 'EndTime', 'Day', 'LogCount', 'UniqueIDCount'] ]
#print rout
rout.to_csv('o_1_hour.csv', index=False, header=False

)

我在哪里进行更改才能获得无错误执行

Error:

File "C:\Program Files\Anaconda3\lib\site-packages\pandas\core\ops.py", line 686, in <lambda>
    lambda x: op(x, rvalues))

TypeError: unsupported operand type(s) for -: 'str' and 'str'

感谢帮助，提前致谢

我认为你需要改变header=0选择第一行到标题 - 然后列名称被列表替换cols.

如果仍然有问题，需要to_numeric http://pandas.pydata.org/pandas-docs/stable/generated/pandas.to_numeric.html，因为其中的一些值StartTime and StopTime是字符串，被解析为NaN, 替换为0最后将列转换为int:

cols = ['UserId', 'UserMAC', 'HotspotID', 'StartTime', 'StopTime']
df = pd.read_csv('canada_mini_unixtime.csv', header=0, names=cols)
#print (df)

df['StartTime'] = pd.to_numeric(df['StartTime'], errors='coerce').fillna(0).astype(int)
df['StopTime'] =  pd.to_numeric(df['StopTime'], errors='coerce').fillna(0).astype(int)

不用找了：

df['m'] = df.StopTime + df.StartTime
df['d'] = df.StopTime - df.StartTime
start = pd.to_datetime(df.StartTime.min(), unit='s').date()
end = pd.to_datetime(df.StopTime.max(), unit='s').date() + pd.Timedelta(days=1)

freq = '1H'  # 1 Hour frequency
idx = pd.date_range(start, end, freq=freq)
r = pd.DataFrame(index=idx)
r['start'] = (r.index - pd.datetime(1970,1,1)).total_seconds().astype(np.int64)

# 1 hour in seconds, minus one second (so that we will not count it twice)
interval = 60*60 - 1

r['LogCount'] = 0
r['UniqueIDCount'] = 0

ix在 pandas 的最新版本中已弃用，因此请使用loc列名称位于[]:

for i, row in r.iterrows():
        # intervals overlap test
        # https://en.wikipedia.org/wiki/Interval_tree#Overlap_test
        # i've slightly simplified the calculations of m and d
        # by getting rid of division by 2,
        # because it can be done eliminating common terms
    u = df.loc[np.abs(df.m - 2*row.start - interval) < df.d + interval, 'UserId']
    r.loc[i, ['LogCount', 'UniqueIDCount']] = [len(u), u.nunique()]

r['Date'] = pd.to_datetime(r.start, unit='s').dt.date
r['Day'] = pd.to_datetime(r.start, unit='s').dt.weekday_name.str[:3]
r['StartTime'] = pd.to_datetime(r.start, unit='s').dt.time
r['EndTime'] = pd.to_datetime(r.start + interval + 1, unit='s').dt.time

print (r)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

TypeError：不支持的操作数类型 -：python 3.x Anaconda 中的“str”和“str” 的相关文章

MacOS Big Sur 中的 NPM 错误“找不到 Python 可执行文件”

我已经花了整整一周的时间寻找这个问题的答案但没有成功我查看了每个 StackOverflow 帖子 Google 的每一篇文章以及我能找到的每个相关的 Github 问题大多数相关错误似乎都比较旧所以我想知道我的问题是否由于我使用的
如何使用 Pycharm 运行 fast-api 服务器？

我有一个简单的 API 函数如下所示 from fastapi import FastAPI app FastAPI app get async def read root return Hello World 我正在使用启动服务器uvi
python win32com.client 调整窗口大小

我正在使用 Python 3 4 1 通过 win32com client 控制 Windows 应用程序我可以激活它我可以发送击键点击等现在我想知道是否有办法调整窗口大小并将其设置到特定位置我找不到方法这里有一些代码片段所以
清理 MongoDB 的输入

我正在为 MongoDB 数据库程序编写 REST 接口并尝试实现搜索功能我想公开整个 MongoDB 接口我确实有两个问题但它们是相关的所以我将它们放在一篇文章中使用 Python json 模块解码不受信任的 JSON 是否
在Python中，如何通过去掉括号和大括号来打印Json

我想以一种很好的方式打印 Json 我想去掉方括号引号和大括号只使用缩进和行尾来显示 json 的结构例如如果我有一个像这样的 Json A A1 1 A2 2 B B1 B11 B111 1 B112 2 B12 B121 1
关于具有自定义损失的 3 输出 ANN 的加权

我正在尝试定义一个自定义损失函数它在回归模型中接收 3 个输出变量 def custom loss y true y pred y true c K cast y true float32 Shape batch size 3 y pre
Python 模块 BeautifulSoup 提取锚点 href

我正在使用 BeautifulSoup 模块通过以下方式从 html 选择所有 href def extract links html soup BeautifulSoup html anchors soup findAll a print
python 硒按名称查找元素

查找电子邮件输入的正确代码是什么https accounts google com ServiceLogin html 是
在 Keras 中使用有状态 LSTM 训练多变量多级数回归问题

我有时间序列P过程每个过程的长度各不相同但都有 5 个变量维度我试图预测测试过程的估计寿命我正在用有状态的方法来解决这个问题LSTM在喀拉斯但我不确定我的训练过程是否正确我将每个序列分成长度的批次30 所以每个序列都是这样的形
哈希 freezeset 与排序元组

在 Python 中给定一组可比较的可散列的元素s 散列是否更好frozenset s or tuple sorted s 这取决于你在做什么创建一个更快frozenset 比排序tuple but frozenset占用的内存比tu
在基本 Tensorflow 2.0 中运行简单回归

我正在学习 Tensorflow 2 0 我认为在 Tensorflow 中实现最基本的简单线性回归是一个好主意不幸的是我遇到了几个问题我想知道这里是否有人可以提供帮助考虑以下设置 import tensorflow as tf 2
配置 Django 和 Google 云存储？

I am not使用应用引擎我有一个在虚拟机上运行的普通 Django 应用程序我想使用 Google Cloud Storage 来提供静态文件以及上传提供媒体文件我有一个水桶如何将 Django 应用程序链接到我的存储桶我
数据类和属性装饰器

我一直在阅读 Python 3 7 的数据类作为命名元组的替代品我通常在必须将数据分组到结构中时使用它我想知道数据类是否与属性装饰器兼容以便为数据类的数据元素定义 getter 和 setter 函数如果是这样是否在某处进行了描
从 SUDS 中的 SOAP 响应中提取 Cookie

我必须使用具有多种服务的 API 所有这些都需要来自下面的身份验证的 JSESSION cookie 然而当我调用下一个服务时它不会保留 cookie 因此会拒绝它们 from suds client import Client url
如何在 Jupyter Notebook 中选择 conda 环境

我安装了 Anaconda 5 3 和 Python 3 7 根环境之后我使用 Python 3 6 创建了一个新环境 py36 我激活了新环境activate py36 conda env list表明环境是活跃的但是当我启动 Jup
根据标签位置计算 Pandas DataFrame 的索引

我正在尝试计算标签的索引Pandas https pandas pydata org DataFrame在每一列中基本上我有以下内容DataFrame d col1 label1 label2 label3 col2 label2 lab
从函数在 python 3 中创建全局变量

我想知道为什么在函数结束后我无法访问变量 variable for raw data 代码是这样的 def htmlfrom Website URL import urllib request response urllib request
如何在Python中不使用库函数将字符串转换为整数？

我正在尝试转换 a 546 to a 546 不使用任何库函数我能想到的最纯粹 gt gt gt a 546 gt gt gt result 0 gt gt gt for digit in a result 10 for d in 01
基于 Web 请求在 Airflow 上运行作业

我想知道是否可以在通过 HTTP 收到请求时执行气流任务我对 Airflow 的调度部分不感兴趣我只是想用它来代替芹菜因此示例操作如下所示用户提交一份表格请求某些报告后端接收请求并向用户发送请求已收到的通知然后后端使用 Ai
从 HDF5 文件中删除信息

我意识到 SO 用户以前曾问过这个问题question https stackoverflow com questions 1124994 removing data from a hdf5 file rq 1但它是在 2009 年被问到的

随机推荐

无法从源 Pylance 解析导入“flask”（reportMissingModuleSource）

当我写作时 from flask import Flask 一条黄线即将出现flask并说明无法从源 Pylance 解析导入 flask reportMissingModuleSource 另外我也能够成功地使用这个包完成工作但问题是
如何在 R闪亮中显示多个.xpt文件并根据它们的列过滤它们？

当我尝试上传多个 xpt 文件以在 R闪亮应用程序的主面板中显示表格时它给我带来了以下问题我也在寻找过滤选项我想在上传多个文件时按列进行过滤以便在每个数据框数据表的主面板中显示适当的行 Error Warning Error in
ORM 和构造函数

我正在研究 NET ORM 实现并且有一个重要的紧迫问题是否有任何 NET ORM 实现不需要数据库中每个字段的公共属性当我看到这样的例子时this https web archive org web 20090831053827 h
Objective-C - 使用 GDB 打印方法参数

我正在努力使用 GDB 调试我的 Objective C 程序我有一个函数 NSString reverse NSString someString我想调试它我设置断点的方法如下 gdb break MyClass reverse 现在
如果当前行包含字符串，如何打印文件中的下一行？

我正在尝试编写一些内容来打印文件中的某些行假设该文件如下所示 name 1 name a name 2 name b name 3 extra 1 name c name 4 extra 1 name d 所以通常我可以做if line
如何将动态外部组件加载到 Angular 应用程序中

我在 Angular 应用程序中遇到问题我想要一个用 Typescript 编写的角度应用程序 aot 目的是显示带有一些小部件的用户仪表板小部件是一个角度组件我的应用程序附带了一些嵌入式小部件但小部件应该通过市场之类的东西来扩展
Elasticsearch：为什么我的查询返回太多结果？

我正在查询http elasticsearch myserver net 9200 my index foo 使用以下查询 query ids type foo values fff bar baz 但我收到的响应有 12 个命中这是我的
并行计算右侧的连续零位（尾随）：解释？

考虑这个链接 http graphics stanford edu seander bithacks html ZerosOnRightParallel来自 Bit Twiddling Hacks 网站为了计算尾随位使用以下算法 uns
预期类型为“System.Int64”，但实际值的类型为“System.String”

有时我们应用程序的用户会收到此信息无效强制转换异常预期类型为 System Int64 但实际值的类型为 System String 我们无法重现这种情况并且它发生在identityDataGrid 模型的 DataGrid Id 字段
如何识别每个簇内的序列？

使用作为一部分的 biofam 数据集TraMineR library TraMineR data biofam lab lt c P L M LM C LC LMC D biofam seq lt seqdef biofam 10 25
分页库使数据源无效不起作用

最近我正在尝试这个我有一个由数据源支持的作业列表我正在使用分页库并且作业列表中的每个项目都有一个保存按钮并且该保存按钮将数据库中作业的状态从未保存更新为已保存反之亦然一旦更新它就会使数据源失效现在失效应该会导致当前页面立即重
如何将这个基于表格的布局转换为 CSS？

我有一个基于表格的布局高度宽度为 100 没有滚动条标题红色自动扩展以适应内容但我不知道它会有多少像素下面的流体表准确地给出了我的内容 table height 100 width 100 tr height 1 td Fit
如何使用 StreamReader 和 StreamWriter 创建文件副本

我需要使用 StreamReader 在控制台应用程序上读取 txt 文件然后创建一个名称不同但内容相同的新文件或备份问题是我无法弄清楚如何使用第一个文件中的内容放入新文件中这是学校的事情我是 C 新手 using System u
matplotlib `imshow(interpolation='nearest')` 有什么作用？

I use imshow功能与interpolation nearest 在灰度图像上并得到一个漂亮的彩色图片看起来它为我做了某种颜色分割到底发生了什么我也想得到类似的图像处理功能 numpy 数组上是否有一些函数例如interpo
毕加索图像不显示

一张图像显示在我的应用程序上另一张图像没有显示但是都可以从浏览器访问我的免费主机中的这个未显示在我的应用程序上请注意我可以从免费主机服务器看到图像 http www justedhak comlu com images uploa
Angular 指令隔离范围上的可选双向绑定

question 我刚刚了解到您可以通过以下方式进行可选的反向或回调绑定 scope parentScopeFunc 我正在尝试查看是否有一种方法可以对双向绑定执行类似的操作 scope optional2WayBoundProp 我尝
如何在 Spring MVC 中使用带注释的映射来实现不区分大小写的 URL

我已经通过我的 spring mvc Web 应用程序很好地注释了映射但是它们区分大小写我找不到一种方法使它们不区分大小写我很乐意在 Spring MVC 中实现这一点而不是以某种方式重定向流量 Spring 4 2将支持不区分大小
Flutter 通过拖动调整 TextField 大小

有什么方法可以创建类似这些点的东西这可以帮助扩展TextField 截屏创建一个小部件 class ExpandableTextField extends StatefulWidget final double height final
GCP：警报触发时是否可以触发云功能？

我正在使用谷歌云平台的谷歌云监控我为我监控的对象创建了一些警报策略但是当有警报触发时有些信息未包含在我希望包含在电子邮件中的信息中因此我正在考虑使用云功能如果在这种情况下可以的话该功能将触发我创建的策略之一如果可能的话请
TypeError：不支持的操作数类型 -：python 3.x Anaconda 中的“str”和“str”

我正在尝试在大型数据集中每小时计算一些实例下面的代码似乎在 python 2 7 上运行良好但我必须将其升级到 3 x 最新版本的 python 并在 Anaconda 上更新所有包当我尝试执行该程序时我正在跟踪str error

TypeError：不支持的操作数类型 -：python 3.x Anaconda 中的“str”和“str”

TypeError：不支持的操作数类型 -：python 3.x Anaconda 中的“str”和“str” 的相关文章

随机推荐

热门标签