使用 Python 解析和渲染 Kinesis Video Streams 并获取输入帧的图像表示

2024-01-01

我设置了一个管道，在其中将视频实时流式传输到 Kinesis Video Stream (KVS)，后者将帧发送到 Amazon Rekognition 进行人脸识别，后者进一步将它们发送到 Kinesis Data Stream (KDS)。最后，KDS 将结果发送给 lambda。

对于已经进行人脸识别的框架，我得到以下格式的JSON：https://docs.aws.amazon.com/rekognition/latest/dg/streaming-video-kinesis-output-reference.html https://docs.aws.amazon.com/rekognition/latest/dg/streaming-video-kinesis-output-reference.html

我的目标是：使用这个 JSON，我想以某种方式获取 KVS 记录的帧的图像表示。

我尝试过什么：

该 JSON 为我提供了片段编号。

我使用这个片段号码并拨打电话获取片段列表的媒体 https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/kinesis-video-archived-media.html#KinesisVideoArchivedMedia.Client.get_media_for_fragment_list

上面的调用返回一个名为Payload作为回应。

我一直在尝试以某种方式将此有效负载渲染成图像。

然而，我每次都无法这样做，因为我不知道如何理解这个有效负载并对其进行解码。

以下是代码片段。

    def getFrameFromFragment(fragment):
         client = boto3.client('kinesis-video-archived-media',endpoint_url=data_endpoint_for_kvs)
         response = client.get_media_for_fragment_list(
             StreamName='kvs1',
             Fragments=[
                fragment,
             ]
         )
         payload = response['Payload']
         print(payload.read())

如何使用此有效负载来获取图像？

我知道 Java 中存在解析器：https://docs.aws.amazon.com/kinesisvideostreams/latest/dg/examples-renderer.html https://docs.aws.amazon.com/kinesisvideostreams/latest/dg/examples-renderer.html

但是，我想知道 Python 中的解决方案。

如果我的问题陈述错误或没有意义，请随时向我询问有关此问题的更多信息。

谢谢您的帮助。 :)

GetMedia 的响应是 MKV 封装格式的流。首先，您需要使用一些 Python 库来从 MKV 格式中提取帧（https://github.com/vi/mkvparse https://github.com/vi/mkvparse或类似）。接下来，您的流可能会被编码。例如H264。如果您需要的话，您还需要解码帧以获得图像的实际位图。似乎有一些基于软件的解码器可用于 Python：https://github.com/DaWelter/h264decoder https://github.com/DaWelter/h264decoder

不过我对这些项目并不熟悉。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Python 解析和渲染 Kinesis Video Streams 并获取输入帧的图像表示的相关文章

嵌套字典中的 Django 模板

我正在使用 Django 模板并且遇到了嵌套字典的一个问题 Dict result dict type 0 file name abc count 0 type 1 file name xyz count 50 我的 HTML 文件中的模
Python 是解释型的还是编译型的，或者两者兼而有之？

据我了解 An 解释的语言是由解释器将高级语言转换为机器代码然后执行的程序实时运行和执行的高级语言它一次处理一点程序 A compiled语言是一种高级语言其代码首先由编译器将高级语言转换为机器代码的程序转换为机器代码然后由执
Python 使用 Gstreamer 访问 USB 麦克风时遇到问题，以便在 Raspberry Pi 上使用 Pocketsphinx 执行语音识别

所以Python的表现就好像它根本听不到我的麦克风发出的任何声音问题就在这里我有一个Python 2 7 假设使用的脚本Gstreamer通过以下方式访问我的麦克风并为我进行语音识别口袋狮身人面像我在用着脉冲音频我的设备是树莓派我的
Pandas dataframe：每批行的操作

我有一个熊猫数据框df我想计算每批行的一些统计信息例如假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框我怎样才能做这样的事情呢这是我想要的一个例子 prin
字符串中的注释和注释中的字符串

我正在尝试使用 Python 和 Regex 计算 C 代码中包含的注释中的字符数但没有成功我可以先删除字符串以删除字符串中的注释但这也会删除注释中的字符串结果会很糟糕是否有机会通过使用正则表达式来询问不匹配注释中的字符串反之亦
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
更改 x 轴比例

我使用 Matlab 创建了这个图使用 matplotlib x 轴绘制大数字例如 100000 200000 300000 我想要 1 2 3 和 10 5 之类的值来指示它实际上是 100000 200000 300000 有没有一
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
如何自动启动我的 ec2 实例、运行命令然后将其关闭？

我想每周对 redshift postgres 数据库中的数据运行一次机器学习模型我使用以下命令将 R 脚本设置为休息 apiplumbr然后我将其设置为一项任务来管理pm2 我有它所以任务会在ec2实例启动然后继续运行要让 R 脚本
使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目，例如哈佛风格

我正在使用 Django 并将 bibtex 存储在我的模型中并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用使其看起来像哈佛引用样式使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
Django - 提交具有同一字段多个输入的表单

预警我对 Django 以及一般的 Web 开发非常陌生我使用 Django 托管一个基于 Web 的 UI 该 UI 将从简短的调查中获取用户输入通过我用 Python 开发的一些分析来提供输入然后在 UI 中呈现这些分析的可视
在 Windows 上使用带有对数刻度的 matplotlib 时出现 Unicode 错误

我正在使用 python 2 6 和 matplotlib 如果我运行 matplotlib 库页面中提供的示例 histogram demo py 它工作正常我已经大大简化了这个脚本 import numpy as np import
使用 NLP 进行地址分割

我目前正在开发一个项目该项目应识别地址的每个部分例如来自 str Jack London 121 Corvallis ARAD ap 1603 973130 输出应如下所示 street name Jack London no 121
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
AWS S3 公共对象与私有对象？

回到 S3 我的存储桶中有图像的 URL 我将在我的应用程序中呈现这些图像但它们被设置为私有当我尝试单击该链接时它显示访问被拒绝当我将链接的设置更改为公共时它会通过但是我读到公共访问并不是最安全的事情所以这本质上是一个由两部
附加两个具有相同列、不同顺序的数据框

我有两个熊猫数据框 noclickDF DataFrame 0 123 321 0 1543 432 columns click id location clickDF DataFrame 1 123 421 1 1543 436 colu
使用Multiprocessing和Pool时如何访问全局变量？

我试图避免将变量冗余地传递到dataList e g 1 globalDict 2 globalDict 3 globalDict 并在全球范围内使用它们 global globalDict然而在下面的代码中并不是这样做的解决方案是否有

随机推荐

Java HashMap 与 Int 数组

我正在使用此代码来检查数组是否存在于HashMap public class Test public static void main String arg HashMap
iOS 9 中的 RTL 语言行为

我们的应用程序支持 RTL 语言如阿拉伯语波斯语 iOS 9 之后导航控制器和选项卡栏控制器的行为已更改我只找到这个链接ios 9 禁用从右到左语言的支持 https stackoverflow com questions 3169
存储不返回字符串离子

我已经实施了Ionic 存储 https ionicframework com docs storage 不知道这是不是新的存储值的东西我创建了一项服务来存储object 它有效因为我有 console logged 它但是当我想要g
如何在 Visual Studio 中更改 SVN URL

在我的办公室我有一个工作存储库我可以在笔记本电脑上修改文件并将它们提交到该存储库我为此使用本地 URL 它直接指向包含存储库的 PC 此外我们还为外部用户发布了此存储库因此他们无需在我们的本地网络上即可对存储库进行更改那里一切都
使用 mongoDB C# 驱动程序，如何发出 runCommand？

mongoDB API 文档似乎缺乏这方面的内容我正在尝试使用聚合函数来获取某个集合中流行标签的计数这是我要执行的命令 db runCommand aggregate articles pipeline unwind Tags grou
Android NDK 和 pthread

我正在使用 android NDK 独立工具链编译 Qt C 项目我使用 make standalone toolchain sh arch arm toolchain arm linux androideabi 4 9 platform
如何修复 npm 错误！解决时：@angular-devkit/bu[email protected] npm ERR！找到：@Angular/[电子邮件受保护]？

我正在尝试在本地更新 Angular cli 版本但是每次运行以下命令时我都会收到以下错误 npm uninstall save dev angular cli 尝试按照所示步骤操作here https www angularjswik
带有模板编译错误的 C++ 类

我不是一个经验丰富的 C 程序员而且我在编译时遇到了问题我有一个使用模板的堆类 template
nhibernate 连接释放模式：为什么文档推荐使用“after_transaction”？

hibernate 文档声明如下配置参数 hibernate connection release mode 用于指定使用哪种释放模式可能的值 auto 默认值相当于当前版本中的 after transaction 更改此默认行为很少
如何使用 Android 设备测量心跳 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 有没有什么技术可以让我使用 Andr
CSS3如何制作矩形透明度渐变？

我正在尝试在 CSS3 中制作矩形渐变就像旧的一样 filter alpha opacity 65 style 3 很遗憾mask image属性我用来实现椭圆形的属性没有矩形渐变选项 CSS3 之前的片段 foto 1 filter
限制对 Ruby on Rails API 的请求

尝试谷歌搜索一个 Rails 插件该插件将允许限制特定资源消耗的请求量姜戈的Piston http bitbucket org jespern django piston wiki Home为此有一些开源代码 Rails 是否有开箱即用
如何检查字符串是否会引发“检测到潜在危险的 Request.Form 值...”错误

如同这个问题 https stackoverflow com questions 2760574 list of input values which will cause the a potentially dangerous reque
当我尝试发布到我的 spring api 时出现 403 禁止？

使用邮递员我可以通过 get 请求获取用户列表 http localhost 8080 users 但是当我向同一地址发送 post 请求时我收到 403 错误 RestController public class UserResou
Android 应用程序在使用 Fragments 和 ViewPager 一段时间后崩溃

当我尝试恢复我的片段时我的 Android 应用程序崩溃了我没有向我尝试恢复的包添加任何自定义变量这都是默认的我正在使用 Fragments 和 ViewPager 请参阅下面我的代码片段 public static class M
使用空方法的默认实现的设计模式

有没有具体的设计模式它描述了提供非抽象默认实现的场景该实现使用空的 NO OP 实现来实现接口上的所有或部分方法这样做的目的是减轻子类实现它们自己可能不需要使用的方法的负担 public interface MyInterface p
是否可以在完整的mysql表中添加自动增量主索引列？

假设该表有近 5 000 000 行 CREATE TABLE author2book author id int 11 NOT NULL book id int 11 NOT NULL KEY author id INDEX author
我如何解决 ImportError: 使用 Huggingface 的 TrainArguments 时，将 `Trainer` 与 `PyTorch` 一起使用需要 `accelerate>=0.20.1`？

我正在使用transformersGoogle colab 中的库以及当我使用 Transformers 库中的 TrainingArguments 时我收到以下代码的导入错误 from transformers import Tra
WPF ListView 数据绑定拖/放自动滚动

我一直在使用 Bea 的解决方案here http bea stollnitz com blog p 53一段时间后发现它非常有帮助现在我遇到的问题是当我将项目拖放到另一个 ListView 控件中或拖放到另一个 ListView 控件
使用 Python 解析和渲染 Kinesis Video Streams 并获取输入帧的图像表示

我设置了一个管道在其中将视频实时流式传输到 Kinesis Video Stream KVS 后者将帧发送到 Amazon Rekognition 进行人脸识别后者进一步将它们发送到 Kinesis Data Stream KDS 最后

使用 Python 解析和渲染 Kinesis Video Streams 并获取输入帧的图像表示

使用 Python 解析和渲染 Kinesis Video Streams 并获取输入帧的图像表示 的相关文章

随机推荐

热门标签

使用 Python 解析和渲染 Kinesis Video Streams 并获取输入帧的图像表示的相关文章