使用 python 将时间范围扩展为具有精确标签的更小增量的更多步骤

2024-02-28

我有一个带有时间戳和标签的文本文件，如下所示：

0.000000    14.463912   tone
14.476425   16.891247   noise
16.891247   21.232923   not_music
21.232923   23.172289   not_music
23.172289   29.128018   not_music

如果我指定步长为 1 秒。我希望这个列表分解为 1 秒长的时间范围但仍带有最近的标签。如何将时间范围分解为较小的步骤但具有准确的标签？

例如，如果我的步数是 1 秒，那么第一行将变成约 14 行，例如：

0.0 1.0 tone
1.0 2.0 tone 
.  
.  
.
13.0 14.0 tone 
[14.0 , 14.46] and [14.47, 15.0] #fall in a grey zone , don't know 
what to do
15.0 16.0 noise

到目前为止，我已成功读取文本文件并将它们存储在如下列表中：

my_segments =[]
for line in open('./data/annotate.txt', 'rb').readlines():
            start, end, label = line.split("\t")
            start = float(start)
            end = float(end)
            label = label.strip()
            my_segments.append((start, end, label))

# print my_segments
for i in range(len(my_segments)):
    print my_segments[i]

我在看https://stackoverflow.com/a/18265979/4932791 https://stackoverflow.com/a/18265979/4932791作者：@Jared，详细介绍了如何使用 numpy 创建具有给定步长的两个数字之间的范围。像这样：

>>> numpy.arange(11, 17, 0.5)
array([ 11. ,  11.5,  12. ,  12.5,  13. ,  13.5,  14. ,  14.5,  15. ,
        15.5,  16. ,  16.5])

无法弄清楚如何在一系列范围内做类似的事情。

我想出的伪代码/算法是：

步骤 1 - 确定步长，
步骤2-将步长分配给与步长相对应的left_variable和right_variable
第 3 步 - 将这一步像窗口一样移动到每个范围并检查如果步长是否在范围内，如果在则分配它是相应的标签。
第 4 步 - 现在更新左侧和右移 1 步。
步骤 5 - 重复步骤 3 直至文件末尾到达了。

我认为要处理边缘情况，我应该将步长减小到 0.25 秒或类似的值，并设置一个条件，如果当前步骤至少有 40 或 50% 重叠，然后我相应地分配标签。

更新：我的无效解决方案：

sliding_window = 0
#st,en = [0.0,1.0]
jumbo= []
for i in range(len(hold_segments)):
    if sliding_window > hold_segments[i][0] and sliding_window+1 < hold_segments[i][1]:
        jumbo.append((sliding_window,sliding_window+1,hold_segments[i][2]))
        sliding_window=sliding_window+1
        print hold_segments[i][2]

对于 pandas 来说，这非常简单，假设您已将数据加载到名为的数据框中df例如：

df

               value        tag
index
0.000000   14.463912   ringtone
14.476425  16.891247      noise
16.891247  21.232923  not_music
21.232923  23.172289    music_B
23.172289  29.128018    music_A


df = df.reindex(
    [i + 0.5 for i in range(math.floor(df.index.min()), math.ceil(df.value.max()))], 
    method='pad'
)

然后使用以下命令恢复范围：

(df.index, df.value) = (df.index - 0.5, df.index + 0.5)

       value        tag
index
0.0      1.0   ringtone
1.0      2.0   ringtone
2.0      3.0   ringtone
3.0      4.0   ringtone
4.0      5.0   ringtone
5.0      6.0   ringtone
6.0      7.0   ringtone
7.0      8.0   ringtone
8.0      9.0   ringtone
9.0     10.0   ringtone
10.0    11.0   ringtone
11.0    12.0   ringtone
12.0    13.0   ringtone
13.0    14.0   ringtone
14.0    15.0      noise
15.0    16.0      noise
16.0    17.0      noise
17.0    18.0  not_music
18.0    19.0  not_music
19.0    20.0  not_music
20.0    21.0  not_music
21.0    22.0    music_B
22.0    23.0    music_B
23.0    24.0    music_A
24.0    25.0    music_A
25.0    26.0    music_A
26.0    27.0    music_A
27.0    28.0    music_A
28.0    29.0    music_A
29.0    30.0    music_A

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Algorithm

NumPy

listcomprehension

使用 python 将时间范围扩展为具有精确标签的更小增量的更多步骤的相关文章

如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
if 语句未命中中的 continue 断点

在下面的代码中两者a and b是生成器函数的输出并且可以评估为None或者有一个值 def testBehaviour self a None b 5 while True if not a or not b continue pri
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
如何从Python中的字符串中提取变量名称和值

我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量更具体地说我对字典变量感兴趣这样我就可以获得变量的值 id和name python 这是由提供
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
在 pytube3 中获取 youtube 视频的标题？

我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题这是我的代码 from pytube import YouTube yt YouTube link print yt titl
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
将名称字符串编码为唯一的数字

我有一大堆名字数以百万计他们每个人都有一个名字一个可选的中间名和一个姓氏我需要将这些名称编码为唯一代表这些名称的数字编码应该是一对一的即一个名称只能与一个数字相关联一个数字只能与一个名称相关联对此进行编码的明智方法是什么我
使用 NumPy 将非均匀数据从文件读取到数组中

假设我有一个如下所示的文本文件 33 346 1223 10 23 11 23 12 23 13 23 14 23 15 23 16 24 10 24 11 24 12 24 13 24 14 24 15 24 16 25 14 25 15
列出所有 k 元组，其条目总和为 n，忽略旋转

有没有一种有效的算法来查找所有序列k总和为的非负整数n 同时避免旋转如果可能的话完全避免顺序很重要但对于我正在解决的问题来说轮换是多余的例如与k 3 和n 3 我想要得到一个如下所示的列表 3 0 0 2 1 0 2 0 1
无法在前端使用 JavaScript Fetch API 将文件上传到 FastAPI 后端

我正在尝试弄清楚如何将图像发送到我的 API 并验证生成的token那是在header的请求到目前为止这就是我所处的位置 app post endreProfilbilde async def endreProfilbilde requ
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
您可以使用关键字参数而不提供默认值吗？

我习惯于在 Python 中使用这样的函数方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

css嵌入无滚动条

好吧我有一个带有 ajax 按钮的页面当您点击 ajax 按钮时它会将一个嵌入对象扔到 data div 中一切正常我的问题是嵌入正在创建一个我不想要的滚动条关于如何防止滚动条有什么想法吗我已经尝试过在任何地方都可以抛出 ov
Webgl使用视口+剪刀更新区域

我一直在尝试创建一个多视口 webgl 应用程序对于每个视图我使用视口剪刀将所有内容渲染得非常好但现在我想改进渲染并只渲染更新的视图因此跳过过度绘制我做了一个小演示来展示这个想法 http kile stravaganza or
LIMIT then RAND 而不是 RAND then LIMIT

我正在使用全文搜索来提取行我根据分数对行进行排序 ORDER BY SCORE 然后在前 20 行 LIMIT 20 中我想对结果集进行兰特 RAND 操作因此对于任何特定的搜索词我想随机显示前 20 个结果中的 5 个我的解决
MSI 安装程序错误 2810 中断安装，但仍然顺利完成

我创建了一个安装应用程序的设置并且仍然如此但它最后开始突然发出奇怪的警告因此当安装过程完成时会出现以下内容安装程序在安装此软件包时遇到意外错误这可能表明此包有问题错误代码是2810 于是我查了2810 上面写着在对话框 2
Angularjs 1.7.9 - 可能未处理的拒绝[重复]

这个问题在这里已经有答案了我经常遇到这个错误Possibly unhandled rejection即使在使用时 promise then success err or promise then success catch err 我应该
Oracle 12c - “number”列上的索引比“varchar”列上的索引执行得更快吗？

假设我在 Oracle 12c 中有一个表其中包含以下列 create table t1 a number 5 0 b varchar 5 0 d e 然后我在具有相同值的两列中插入 100 000 000 条记录例如 20151 an
将 Android Studio 项目与 Gradle 文件同步

I was working on a project and then I got a prompt to update Android Studio After I did that I started getting this erro
如何以编程方式触发浏览器的搜索？

我喜欢做的是通过 JavaScript 以编程方式触发浏览器的页面搜索功能 I e when a page is loaded and the the user presses Ctrl F a search field is opened
JobStorage.Current 属性值尚未初始化。您必须在使用 Hangfire 客户端或服务器 API 之前设置它

我在 mvc 应用程序中使用hangfire 我正在向用户发送提醒预约我已经在我的应用程序中安装了hangfire 我已经配置了hangfire 启动 cs 类但是当我运行该应用程序时它会产生以下错误作业存储当前属性值尚未初始化
Python中快速嵌套列表的意外更新结果[重复]

这个问题在这里已经有答案了为什么下面不能更新第一个元素而是整列 gt gt gt x 2 2 1 gt gt gt x 1 1 1 1 gt gt gt x 0 0 2 gt gt gt x 2 1 2 1 即使这是明显的重复但使用ran
Android：ListView.getScrollY() - 它有效吗？

我正在使用它但它总是返回 0 即使我已经滚动到列表末尾 getScrollY 实际上是View上的方法而不是ListView上的方法它指的是整个视图的滚动量所以它几乎总是0 如果你想知道ListView的内容滚动了多远可以使用li
气球弹出 WPF

我需要显示一个气球弹出窗口 WPF中有针对此类工作的控件吗像下面这样
在 Swift 中从 iPhone 加载联系人会崩溃

我正在尝试加载我的应用程序的联系人它在模拟器中运行良好但在 iPhone 上却崩溃了我正在使用的代码 func getContactNames let allContacts ABAddressBookCopyArrayOfAllPe
将 SQL 列空值转换为 0

我是 SQL Server 新手有一个问题我有这样的视图其中公式中的某些列允许为空我如何将这些空值转换为 0 因为如果它们为空则公式的结果也将为空 Thanks CREATE VIEW vwAchizitii AS SELECT
while 循环内的表变量并非每次都初始化：SQL Server

我想知道为什么 while 循环内的表变量的行为与其他变量不同表变量仅创建一次并将在整个循环中使用但每次循环增加时其他变量都会被初始化查看下面的代码以获取更多信息 declare tt int set tt 10 while tt
Angular2 - 表达式在检查后已更改 - 通过调整大小事件绑定到 div 宽度

我已经对此错误进行了一些阅读和调查但不确定适合我的情况的正确答案是什么我知道在开发模式下更改检测会运行两次但我不愿意使用enableProdMode 来掩盖问题这是一个简单的示例其中表格中的单元格数量应随着 div 宽度的扩展而
如何找到matplotlib样式名称？

是否可以知道当前matplotlib样式的名称我知道我可以使用以下命令获取所有可用样式的列表plt style available 但我想要的是获取当前使用的样式名称的可能性我正在spyder python 3 5的ipython控制台
未找到启动器活动

我找不到任何问题但它一直给我错误未找到启动器活动和启动只会同步设备上的应用程序包有人能解决这个问题吗这是我的Maniest
尽管存在预期，但规范没有预期控制台错误

我有必须期待的规范但它仍然说没有期望 it should click on yes button of technician and check save continue functionality gt const saveAndCo
使用 python 将时间范围扩展为具有精确标签的更小增量的更多步骤

我有一个带有时间戳和标签的文本文件如下所示 0 000000 14 463912 tone 14 476425 16 891247 noise 16 891247 21 232923 not music 21 232923 23 1722

使用 python 将时间范围扩展为具有精确标签的更小增量的更多步骤

使用 python 将时间范围扩展为具有精确标签的更小增量的更多步骤 的相关文章

随机推荐

热门标签

使用 python 将时间范围扩展为具有精确标签的更小增量的更多步骤的相关文章