AWS S3图像保存丢失元数据

2024-02-24

我正在使用用 python 2.7x 编写的 AWS Lambda 函数，该函数下载、保存到 /tmp ，然后将图像文件上传回存储桶。

我的图像元数据从带有 http 标头（例如 Content-Type= image/jpeg 等）的原始存储桶开始。

使用 PIL 保存图像后，所有标头都消失了，只剩下 Content-Type = binary/octet-stream

据我所知，由于 PIL 的工作方式，image.save 正在丢失标头。如何保留元数据或至少将其应用到新保存的图像？

我看到过帖子暗示此元数据位于 exif 中，但我尝试从原始文件中获取 exif 信息并应用于保存的文件，但没有成功。无论如何，我不清楚它是否存在于 exif 数据中。

部分代码可以让您了解我在做什么：

def resize_image(image_path):
    with Image.open(image_path) as image:
    image.save(upload_path, optimize=True)

def handler(event, context):
    global upload_path
    for record in event['Records']:
        bucket = record['s3']['bucket']['name']
        key = urllib.unquote_plus(event['Records'][0]['s3']['object']['key'].encode("utf8"))

        download_path = '/tmp/{}{}'.format(uuid.uuid4(), file_name)
        upload_path = '/tmp/resized-{}'.format(file_name)

        s3_client.download_file(bucket, key, download_path)

        resize_image(download_path)
        s3_client.upload_file(upload_path, '{}resized'.format(bucket), key)

感谢 Sergey，我改为使用 get_object 但响应缺少元数据：

response = s3_client.get_object(Bucket=bucket,Key=key)

响应= {u'Body'：，u'AcceptRanges'：'字节'，u'ContentType'：'image/jpeg'，'ResponseMetadata'：{'HTTPStatusCode'：200，'RetryAttempts'：0，'HostId'： 'au30hBMN37/ti0WCfDqlb3t9ehainumc9onVYWgu+CsrHtvG0u/zmgcOIvCCBKZgQrGoooZoW9o='，'RequestId'：'1A94D7F01914A787'，'HTTPHeaders'：{'内容长度'：'84053'，'x-amz-id -2': 'au30hBMN37/ti0WCfDqlb3t9ehainumc9onVYWgu+CsrHtvG0u /zmgcOIvCCBKZgQrGoooZoW9o=', '接受范围': '字节', '过期': 'Sun, 2034 年 1 月 1 日 00:00:00 GMT', '服务器': 'AmazonS3', '最后修改': '星期五, 2016 年 12 月 23 日 15:21:56 GMT', 'x-amz-request-id': '1A94D7F01914A787', 'etag': '"9ba59e5457da0dc40357f2b53715619d"', '缓存控制': 'max-age=2592000,public' , '日期': '2016 年 12 月 23 日星期五 15:21:58 GMT', '内容类型': 'image/jpeg'}}, u'LastModified': datetime.datetime(2016, 12, 23, 15, 21, 56, tzinfo=tzutc()), u'ContentLength': 84053, u'过期': datetime.datetime(2034, 1, 1, 0, 0, tzinfo=tzutc()), u'ETag': ' "9ba59e5457da0dc40357f2b53715619d"', u'CacheControl': 'max-age=2592000,public', u'元数据': {}}

如果我使用：元数据 = 响应['ResponseMetadata']['HTTPHeaders']

元数据 = {'内容长度'：'84053'，'x-amz-id-2'：'f5UAhWzx7lulo3cMVF8hdVRbHnhdnjHWRDl + LDFkYm9pubjL0A01L5yWjgDjWRE4TjRnjqDeA0U ='，'接受范围'：'字节'，'过期'：' 2034 年 1 月 1 日，星期日00:00:00 GMT', '服务器': 'AmazonS3', '上次修改': '2016 年 12 月 23 日星期五 15:47:09 GMT', 'x-amz-request-id': '4C69DF8A58EF3380', 'etag': '"9ba59e5457da0dc40357f2b53715619d"', '缓存控制': 'max-age=2592000,public', '日期': '2016 年 12 月 23 日星期五 15:47:10 GMT', '内容类型': '图像/jpeg'}

使用 put_object 保存

s3_client.put_object(Bucket=bucket+'resized',Key=key, Metadata=metadata, Body=downloadfile)

在 s3 中创建大量额外元数据，包括它不将内容类型保存为 image/jpeg，而是保存为二进制/八位字节流，并且它确实创建元数据 x-amz-meta-content-type = image/jpeg

您混淆了由 AWS S3 与对象一起存储的 S3 元数据和存储在文件本身内部的 EXIF 元数据。

download_file()不从 S3 获取对象属性。你应该使用get_object()反而：https://boto3.readthedocs.io/en/latest/reference/services/s3.html#S3.Client.get_object https://boto3.readthedocs.io/en/latest/reference/services/s3.html#S3.Client.get_object

然后你可以使用put_objects()使用相同的属性上传新文件：https://boto3.readthedocs.io/en/latest/reference/services/s3.html#S3.Client.put_object https://boto3.readthedocs.io/en/latest/reference/services/s3.html#S3.Client.put_object

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

AWS S3图像保存丢失元数据的相关文章

如何指定聚类的距离函数？

我想对给定距离的点进行聚类奇怪的是似乎 scipy 和 sklearn 聚类方法都不允许指定距离函数例如在sklearn cluster AgglomerativeClustering 我唯一可以做的就是输入一个亲和力矩阵这将非常
通过 boto3 承担 IAM 用户角色时访问被拒绝

Issue 我有一个 IAM 用户和一个 IAM 角色我正在尝试将 IAM 用户配置为有权使用 STS 承担 IAM 角色我不确定为什么收到访问被拒绝错误 Details IAM 角色 arn aws iam 123456789 r
Tkinter 菜单删除项

如何删除任何菜单项例如我想删除播放 self menubar Menu self root self root config menu self menubar self filemenu2 Menu self menubar self
从字典的元素创建 Pandas 数据框

我正在尝试从字典创建一个 pandas 数据框字典设置为 nvalues y1 1 2 3 4 y2 5 6 7 8 y3 a b c d 我希望数据框仅包含 y1 and y2 到目前为止我可以使用 df pd DataFrame fr
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
使用 Python 3 动态插入到 sqlite

我想使用 sqlite 写入多个表但我不想提前手动指定查询有数十种可能的排列例如 def insert sqlite tablename data list global dbc dbc execute insert into tab
从 pyspark.sql 中的列表创建数据框

我完全陷入了有线的境地现在我有一个清单li li example data map lambda x get labeled prediction w x collect print li type li 输出就像 0 0 59 0 0
是否有一个包可以维护所有带有符号的货币列表？

是否有一个 python 包提供所有或相当完整货币的列表与符号如美元的有优秀的pycountry 贪财的 https github com limist py moneyed and ccy http code google com
如何使用 opencv python 计算乐高积木上的孔数？

我正在开发我的 python 项目我需要计算每个乐高积木组件中有多少个孔我将从输入 json 文件中获取有关需要计算哪个程序集的信息如下所示 img 001 red 0 blue 2 white 1 grey 1 yellow 1 r
Jupyter 笔记本中未显示绘图图表

我已经尝试解决这个问题几个小时了我按照上面的步骤操作情节网站 https plot ly python getting started start plotting online并且图表仍然没有显示在笔记本中这是我的情节代码 color
为什么在Python解释器中输入_会返回True？ [复制]

这个问题在这里已经有答案了我的翻译行为非常奇怪 gt gt gt True gt gt gt type True
检索 geodjango 多边形对象的边界框

如何在 geodjango 中获取 MultiPolygon 对象的边界框在 API 中找不到任何内容http geodjango org docs geos html http geodjango org docs geos html
为正则表达式编写解析器

即使经过多年的编程我很羞愧地说我从未真正完全掌握正则表达式一般来说当问题需要正则表达式时我通常可以在一堆引用语法之后想出一个合适的正则表达式但我发现自己越来越频繁地使用这种技术所以自学并理解正则表达式properly 我决
将字符串中的随机字符转换为大写

我尝试随机附加文本字符串这样就不只是有像这样的输出 gt gt gt david 我最终会得到类似的东西 gt gt gt DaViD gt gt gt dAviD 我现在的代码是这样的 import random import stri
Discord.py 嵌入中禁用按钮/冻结按钮

I m trying to make a replica of this bot in which when I press any of the buttons below it shows a dropdown menu and you
如何通过函数注释指示函数需要函数作为参数，或返回函数？

您可以使用函数注释 http www python org dev peps pep 3107 在python 3中指示参数和返回值的类型如下所示 def myfunction name str age int gt str return
如何绘制更大的边界框和仅裁剪边界框文本 Python Opencv

我正在使用 easyocr 来检测图像中的文本该方法给出输出边界框输入图像如下所示 Image 1 Image 2 使用下面的代码获得输出图像 But I want to draw a Single Bigger bounding bo
Python 中的 Unix cat 函数 (cat * > merged.txt)？ [复制]

这个问题在这里已经有答案了一旦建立了目录有没有办法在Python中使用Unix中的cat函数或类似的函数我想将 files 1 3 合并到 merged txt 我通常会在 Unix 中找到该目录然后运行 cat gt merged
使用 Ruby aws-sdk 跟踪文件到 S3 的上传进度

首先我知道SO中有很多与此类似的问题在过去的一周里我读了大部分如果不是全部但我仍然无法让这项工作为我工作我正在开发一个 Ruby on Rails 应用程序允许用户将 mp3 文件上传到 Amazon S3 上传本身工作正常
描述符“join”需要“unicode”对象，但收到“str”

代码改编自here http wiki geany org howtos convert camelcase from foo bar to Foo Bar def lower case underscore to camel case s

随机推荐

未命中断点 Mono For Android (Monodroid)

我的 monodroid 应用程序构建并运行良好但未命中断点这适用于物理设备和模拟器我创建了一个新的默认 monodroid 应用程序它确实遇到了断点我尝试过重建重新启动 ADB 和重新启动我运行的是 VS2010 M4A 版
Firebase Google Cloud 从设备到设备的消息传递

我无法理解如何将消息从 iOS 设备发送到另一台 iOS 设备并试图了解两者之间的区别 Firebase 通知和 Google Cloud Messaging Firebase 通知假设您可以从服务器向设备发送消息谷歌云消息它将消息从
ElasticSearch：根据字段长度过滤文档

我在 SO 上读到了几个类似的问题并建议解决方案不起作用我想找到单词短于8的所有字段我的数据库屏幕我尝试使用此查询来执行此操作 query match all filter script script doc word length
Cordova iOS 6.1.1 白色启动画面

在我的 Cordova 应用程序中升级到 cordova ios 6 1 1 后遇到问题应用程序运行正常但未显示启动屏幕只有一个白屏就像我的闪屏文件被忽略一样我有这个 config xml 文件
如何处理`已被弃用。在 Java 中已弃用？

我想使用的代码 window addFlags WindowManager LayoutParams FLAG SHOW WHEN LOCKED 有FLAG SHOW WHEN LOCKED https developer android
关闭 OpenMP

在我的 C 程序中我希望有时使用 OpenMP 有时不使用 OpenMP 即多线程或单线程来运行其可执行文件我正在考虑以下两种情况中的任何一种我的代码如何使用 OpenMP 1 假设我的代码只有 include
无法为 jasmine 设置超时

我已经尝试了所有解决方案这个答案 https stackoverflow com questions 9867601 how do i change the timeout on a jasmine node async spec但他们都不
Spring Mvc 中从控制器返回 Hashmap 到 JSP

我在 Jsp 中有两个下拉列表一个用于州另一个用于国家一旦我选择国家地区国家列表就会自动填充相应的列表但我得到整个 jsp 页面作为 ajax 调用的响应我的ajax程序 select country change funct
为什么图像没有保存在我的代码中而只是由管理页面保存？

我需要知道为什么图像不保存在路径中我从路径中检查静态根和媒体根似乎都工作良好但图像未保存这里是代码您可以在其中看到发生了什么 notice 该图像工作正常并已通过管理页面安装但无法保存或通过我的代码工作模型 py class
Power Query M - 表达式错误 - 列表到文本

我正在使用 Web Contents 执行 API 请求我提交了一个从函数获取的动态访问令牌 let Source Json Document Web Contents https api url com endpoint id Head
捕获蓝牙远程快门事件

我想知道如何是否可以在 android 中捕获由蓝牙远程快门事件触发的事件例如这样的一个 http www avancaproducts com en shop other bluetooth camera shutter remote
在 docker 中运行 json-server

我一直在跑步json 服务器 https github com typicode json server使用以下配置在 docker 容器中成功运行了一段时间泊坞窗文件 FROM node alpine EXPOSE 3000 COPY
在自定义 UIGestureRecognizer 中实现速度

我编写了一个自定义 UIGestureRecognizer 它可以用一根手指处理旋转它的设计工作方式与 Apple 的 UIRotationGestureRecognizer 完全相同并返回相同的值现在我想实现速度但我无法弄清楚苹
我应该使用 XSD 1.1 来构建开放标准吗？

我们被要求为开放 XML 标准整合一组模式 XSD 1 0 可以处理大多数规则但在某些地方会有点混乱特别是考虑到可扩展性它还依赖于实现者以注释的形式阅读某些规则的自由文本描述几乎所有规则都可以使用 XSD 1 1 来实现但是我们不
Java不发送客户端证书

我在 Java 1 7 上使用 HttpClient 4 2 3 连接到 nginx 托管的远程服务器我的组织广泛使用 PKI 并且远程和客户端都具有由通用 CA 颁发的证书服务器有一个如下的签名链 CN Server 123 OU S
.NET 中泛型集合和非泛型集合之间的内存使用差异

我读到收藏品如今在 NET 中众所周知使用有一些优点通用集合 over 非通用的它们是类型安全的没有转换没有装箱拆箱这就是通用集合具有性能优势的原因如果我们认为非泛型集合将每个成员存储为object 那么我们可以认为泛型也具
适用于 OS X 的虚拟 HID 键盘

我正在尝试创建一个虚拟的蓝牙Mac 操作系统的键盘客户端这意味着我的 Mac 将充当 BT KB 我读到了 OS X 中的蓝牙 API 在 ObjC 中并且我还发现了适用于 Mac 的 HID API 在 C 中为了完成这项工作我知
如何使用Android Studio获取代码覆盖率？

我正在使用 Android Studio 开发应用程序我能够运行测试代码但是我不知道如何在 android studio 中获得代码覆盖率我已经看过以下链接 Android Gradle 代码覆盖率 https stackoverf
PHP/MYSQL 父子关系

我有一个这样的表 id name 父 ID 然后我想根据它们的 id 选择某些行所以像这样 SELECT FROM TABLE WHERE id IN 1 5 8 9 35 我想从这个查询中也显示父子关系例如 id parent 1
AWS S3图像保存丢失元数据

我正在使用用 python 2 7x 编写的 AWS Lambda 函数该函数下载保存到 tmp 然后将图像文件上传回存储桶我的图像元数据从带有 http 标头例如 Content Type image jpeg 等的原始存储桶开

AWS S3图像保存丢失元数据

AWS S3图像保存丢失元数据 的相关文章

随机推荐

热门标签

AWS S3图像保存丢失元数据的相关文章