caffe-python lmdb 读写（转）

2023-11-06

lmdb-write

import lmdb
import numpy as np
import cv2
import caffe
from caffe.proto import caffe_pb2

#basic setting
# 这个设置用来存放lmdb数据的目录
lmdb_file = 'lmdb_data'
batch_size = 256

# create the lmdb file
# map_size指的是数据库的最大容量，根据需求设置
lmdb_env = lmdb.open(lmdb_file, map_size=int(1e12))
lmdb_txn = lmdb_env.begin(write=True)
# 因为caffe中经常采用datum这种数据结构存储数据
datum = caffe_pb2.Datum()

item_id = -1
for x in range(1000):
    item_id += 1

    #prepare the data and label

    #data = np.ones((3,64,64), np.uint8) * (item_id%128 + 64) #CxHxW array, uint8 or float
    # pic_path设置成图像目录, 0表示读入灰度图
    data = cv2.imread(pic_path, 0)
    # label 设置图像的label就行
    label = item_id%128 + 64

    # save in datum
    datum = caffe.io.array_to_datum(data, label)
    keystr = '{:0>8d}'.format(item_id)
    lmdb_txn.put( keystr, datum.SerializeToString() )

    # write batch
    if(item_id + 1) % batch_size == 0:
        lmdb_txn.commit()
        lmdb_txn = lmdb_env.begin(write=True)
        print (item_id + 1)

# write last batch
if (item_id+1) % batch_size != 0:
    lmdb_txn.commit()
    print 'last batch'
    print (item_id + 1)

lmdb-read

import caffe
import lmdb
import numpy as np
import cv2
from caffe.proto import caffe_pb2

lmdb_env = lmdb.open('lmdb_data')
lmdb_txn = lmdb_env.begin()
lmdb_cursor = lmdb_txn.cursor()
datum = caffe_pb2.Datum()

for key, value in lmdb_cursor:
    datum.ParseFromString(value)

    label = datum.label
    data = caffe.io.datum_to_array(datum)

    #CxHxW to HxWxC in cv2
    image = np.transpose(data, (1,2,0))
    cv2.imshow('cv2', image)
    cv2.waitKey(1)
    print('{},{}'.format(key, label))

lmdb数据库
LMDB 的全称是 Lighting Memory-Mapped Database（闪电般的内存映射数据库）。它文件结构简单，一个文件夹，里面一个数据文件，一个锁文件。数据随意复制，随意传输。它的访问简单，不需要运行单独的数据管理进程。只要在访问的代码里引用 LMDB 库，访问时给文件路径即可。

Caffe 中使用的数据较为很简单，就是大量的矩阵/向量平铺开来。数据之间没有什么关联，数据内没有复杂的对象结构，就是向量和矩阵。既然数据并不复杂，Caffe 就选择了 LMDB 这个简单的数据库来存放数据。

这里写图片描述

Caffe 中 Datum 数据结构
Caffe 并不是把向量和矩阵直接放进数据库的，而是将数据通过 caffe.proto 里定义的一个 datum 类来封装的。数据库里存放的是一个个 datum 序列化成的字符串。Datum 的定义如下：

message Datum {
  optional int32 channels = 1;
  optional int32 height = 2;
  optional int32 width = 3;
  // the actual image data, in bytes
  optional bytes data = 4;
  optional int32 label = 5;
  // Optionally, the datum could also hold float data.
  repeated float float_data = 6;
  // If true data contains an encoded image that need to be decoded
  optional bool encoded = 7 [default = false];
}

一个 Datum 有三个维度，channnels、height、width，可以看作是少了 num 维度的 Blob。存放数据的地方有两个：bytes data、float_data，分别存放整数型和浮点型数据。图像数据一般是整形，放在 bytes data 中，特征向量一般是浮点型，存放在 float_data 中。 label 里存放的是类别标签，是整数型。encoded 标识数据是否需要被解码，因为里面可能存放的是 JPEG 或者 PNG 之类经过编码的数据。Datum 这个数据结构将数据和标签封装在一起，兼容整形和浮点型数据。经过 protobuf 编译后，可以在 Python 和 C++ 中都提供高效的访问。同时protobuf 还为它提供了序列化、反序列化的功能。存放进 LMDB 的就是 Datum 序列化生成的字符串。
下面通过代码来说明吧，这段代码是一个大牛写的教程：《A Practical Introduction to Deep Learning with Caffe and Python》，写的很清晰。

import os
import glob
import random
import numpy as np

import cv2

import caffe
from caffe.proto import caffe_pb2
import lmdb

#Size of images
IMAGE_WIDTH = 227
IMAGE_HEIGHT = 227

# train_lmdb、validation_lmdb 路径
train_lmdb = '/home/chenxp/Documents/vehicleID/val/train_lmdb'
validation_lmdb = '/home/chenxp/Documents/vehicleID/val/validation_lmdb'

# 如果存在了这个文件夹, 先删除
os.system('rm -rf  ' + train_lmdb)
os.system('rm -rf  ' + validation_lmdb)

# 读取图像
train_data = [img for img in glob.glob("/home/chenxp/Documents/vehicleID/val/query/*jpg")]
test_data = [img for img in glob.glob("/home/chenxp/Documents/vehicleID/val/query/*jpg")]

# Shuffle train_data
# 打乱数据的顺序
random.shuffle(train_data)

# 图像的变换, 直方图均衡化, 以及裁剪到 IMAGE_WIDTH x IMAGE_HEIGHT 的大小
def transform_img(img, img_width=IMAGE_WIDTH, img_height=IMAGE_HEIGHT):
    #Histogram Equalization
    img[:, :, 0] = cv2.equalizeHist(img[:, :, 0])
    img[:, :, 1] = cv2.equalizeHist(img[:, :, 1])
    img[:, :, 2] = cv2.equalizeHist(img[:, :, 2])

    #Image Resizing, 三次插值
    img = cv2.resize(img, (img_width, img_height), interpolation = cv2.INTER_CUBIC)
    return img

def make_datum(img, label):
    #image is numpy.ndarray format. BGR instead of RGB
    return caffe_pb2.Datum(
        channels=3,
        width=IMAGE_WIDTH,
        height=IMAGE_HEIGHT,
        label=label,
        data=np.rollaxis(img, 2).tobytes())　# or .tostring() if numpy < 1.9

# 打开 lmdb 环境, 生成一个数据文件，定义最大空间, 1e12 = 1000000000000.0
in_db = lmdb.open(train_lmdb, map_size=int(1e12)) 
with in_db.begin(write=True) as in_txn: # 创建操作数据库句柄
    for in_idx, img_path in enumerate(train_data):
        if in_idx %  6 == 0: # 只处理 5/6 的数据作为训练集
            continue         # 留下 1/6 的数据用作验证集
        # 读取图像. 做直方图均衡化、裁剪操作
        img = cv2.imread(img_path, cv2.IMREAD_COLOR)
        img = transform_img(img, img_width=IMAGE_WIDTH, img_height=IMAGE_HEIGHT)

        if 'cat' in img_path: # 组织 label, 这里是如果文件名称中有 'cat', 标签就是 0
            label = 0         # 如果图像名称中没有 'cat', 有的是 'dog', 标签则为 1
        else:                 # 这里方, label 需要自己去组织
            label = 1         # 每次情况可能不一样, 灵活点

        datum = make_datum(img, label)
        # '{:0>5d}'.format(in_idx):
        #      lmdb的每一个数据都是由键值对构成的,
        #      因此生成一个用递增顺序排列的定长唯一的key
        in_txn.put('{:0>5d}'.format(in_idx), datum.SerializeToString()) #调用句柄，写入内存
        print '{:0>5d}'.format(in_idx) + ':' + img_path

# 结束后记住释放资源，否则下次用的时候打不开。。。
in_db.close() 

# 创建验证集 lmdb 格式文件
print '\nCreating validation_lmdb'
in_db = lmdb.open(validation_lmdb, map_size=int(1e12))
with in_db.begin(write=True) as in_txn:
    for in_idx, img_path in enumerate(train_data):
        if in_idx % 6 != 0:
            continue
        img = cv2.imread(img_path, cv2.IMREAD_COLOR)
        img = transform_img(img, img_width=IMAGE_WIDTH, img_height=IMAGE_HEIGHT)
        if 'cat' in img_path:
            label = 0
        else:
            label = 1
        datum = make_datum(img, label)
        in_txn.put('{:0>5d}'.format(in_idx), datum.SerializeToString())
        print '{:0>5d}'.format(in_idx) + ':' + img_path
in_db.close()
print '\nFinished processing all images'

再展示一段生成 lmdb 的代码，来源自：http://deepdish.io/2015/04/28/creating-lmdb-in-python/
这段代码并没有用真实的图像数据来生成，二是用 numpy 中的 np.zeros() 生成了图像格式的数据：

import numpy as np
import lmdb
import caffe

N = 1000

# Let's pretend this is interesting data
X = np.zeros((N, 3, 32, 32), dtype=np.uint8)
y = np.zeros(N, dtype=np.int64)

# We need to prepare the database for the size. We'll set it 10 times
# greater than what we theoretically need. There is little drawback to
# setting this too big. If you still run into problem after raising
# this, you might want to try saving fewer entries in a single
# transaction.
map_size = X.nbytes * 10

env = lmdb.open('mylmdb', map_size=map_size)

with env.begin(write=True) as txn:
    # txn is a Transaction object
    for i in range(N):
        datum = caffe.proto.caffe_pb2.Datum()
        datum.channels = X.shape[1]
        datum.height = X.shape[2]
        datum.width = X.shape[3]
        datum.data = X[i].tobytes()  # or .tostring() if numpy < 1.9
        datum.label = int(y[i])
        str_id = '{:08}'.format(i)

        # The encode is only essential in Python 3
        txn.put(str_id.encode('ascii'), datum.SerializeToString())

下面就是从生成好的 lmdb 中读取数据了：

import caffe
from caffe.proto import caffe_pb2

import lmdb
import cv2
import numpy as np

lmdb_env = lmdb.open('mylmdb', readonly=True) # 打开数据文件
lmdb_txn = lmdb_env.begin() # 生成处理句柄
lmdb_cursor = lmdb_txn.cursor() # 生成迭代器指针
datum = caffe_pb2.Datum() # caffe 定义的数据类型

for key, value in lmdb_cursor: # 循环获取数据
    datum.ParseFromString(value) # 从 value 中读取 datum 数据

    label = datum.label
    data = caffe.io.datum_to_array(datum)
    print data.shape
    print datum.channels
    image = data.transpose(1, 2, 0)
    cv2.imshow('cv2.png', image)
    cv2.waitKey(0)

cv2.destroyAllWindows()
lmdb_env.close()

转载自：
http://blog.csdn.net/u010167269/article/details/51915512?locationNum=5
https://www.cnblogs.com/zhonghuasong/p/7469750.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

caffe

caffe-python lmdb 读写（转）的相关文章

caffe cudnn出现错误: declaration is incompatible with "const char *cudnnGetErrorString(cudnnStatus_t)"

cudnn h中 inline const char cudnnGetErrorString cudnnStatus t status 修改为 inline const char CUDNNWINAPI cudnnGetErrorStrin
TensorRT Samples: GoogleNet

关于TensorRT的介绍可以参考 http blog csdn net fengbingchun article details 78469551 以下是参考TensorRT 2 1 2中的sampleGoogleNet cpp文件改写的
[caffe]：检查失败：检查失败：hdf_blobs_[i]->shape(0) == num（200 vs. 6000）

我有训练并将数据标记为 data mat 我有 200 个训练数据包含 6000 个特征标签为 1 1 已保存在 data mat 中我正在尝试将数据转换为 hdf5 并使用以下命令运行 C affe load data mat hd
如何将 .npy 文件转换为 .binaryproto？

我使用 python 创建了一个平均图像文件并将其保存到 numpy 文件中我想知道如何将此 npy 文件转换为 binaryproto 文件我正在使用此文件来使用 GoogLeNet 进行训练您可以简单地使用 numpy 创建 bi
三元组损失的softmax版本的梯度计算

我一直在尝试在Caffe中实现softmax版本的三元组损失描述于霍弗和艾隆使用三元组网络进行深度度量学习 ICLR 2015 我已经尝试过这个但我发现很难计算梯度因为指数中的 L2 不是平方的有人可以帮我吗使用现有的 caf
如何修改Imagenet Caffe模型？

我想修改 ImageNet caffe 模型如下所述由于时间网络的输入通道数与此不同空间网络 20 vs 3 我们对 ImageNet 模型滤波器进行平均先跨过通道一层然后复制平均结果 20 时间网络的初始化我的问题是如何才能达
如何在caffe中将多个N维数组输入到网络中？

我想在 caffe 中创建一个用于语义分割的自定义损失层需要多个输入我希望这个损失函数有一个额外的输入因子以惩罚小物体的漏检为此我创建了一个图像 GT 其中每个像素都包含一个权重如果像素属于小物体则权重较高我是 caffe
PyCaffe中的layer模块在哪里定义

我正在修改一个Caffe教程 http nbviewer jupyter org github BVLC caffe blob master examples pascal multilabel with datalayer ipynb实现
Caffe 模型为每个图像提供相同的输出

我刚刚使用预定义的 prototxt 和 caffemodel 文件在 caffe 中加载了 alexnet 然而将任何图像发送到模型都会返回与 fc7 层的输出相同的值这是代码片段 net caffe Net alexnet trai
CNN 上的快速损失收敛意味着什么？

我正在两个不同的深度学习库 Caffe e Tensorflow 中训练两个 CNN AlexNet e GoogLeNet 该网络由每个图书馆的开发团队实施 here https github com BVLC caffe tree ma
Caffe 中的欧几里得损失层

我目前正在尝试在 caffe 中实现我自己的损失层在尝试这样做的同时我使用其他层作为参考然而让我困惑的一件事是使用top 0 gt cpu diff in Backward cpu 我将使用EuclideanLossLayer作为参
如何在非 NVIDIA 设置上加速深度学习？

由于我只有 AMD A10 7850 APU 并且没有资金购买 800 1200 美元的 NVIDIA 显卡因此我正在尝试利用我拥有的资源通过 TensorFlow Keras 加速深度学习最初我使用了 Tensorflow 的预编译
使用 Caffe 没有提高 RMSprop、Adam、AdaDelta 测试精度

I am finetuning using Caffe在图像数据集上Tesla K40 用一个batch size 47 solver type SGD base lr 0 001 lr policy step momentum 0 9 g
Caffe 求解器中的average_loss 字段有什么用？

有什么用average loss 有人可以举个例子或者用通俗易懂的语言解释一下吗您可以在caffe proto https github com BVLC caffe blob master src caffe proto caffe p
在 ubuntu 16.04 中安装 Caffe 时遇到困难

操作系统 ubuntu 16 04 CUDA 7 5 库德恩 5 我正在关注this https github com BVLC caffe wiki Ubuntu 16 04 or 15 10 OpenCV 3 1 Installatio
caffe全卷积cnn - 如何使用裁剪参数

我正在尝试为我的问题训练一个完全卷积网络我正在使用实施https github com shelhamer fcn berkeleyvision org https github com shelhamer fcn berkeleyvis
nvcc fatal：安装 cuda 9.1+caffe+openCV 3.4.0 时不支持 gpu 架构“compute_20”

我已经安装了CUDA 9 1 cudnn 9 1 opencv 3 4 0 caffe 当我尝试跑步时make all j8 in caffe目录下出现这个错误 nvcc fatal 不支持的 GPU 架构 compute 20 我尝试过
Caffe：如果内存中只能容纳一小部分，我该怎么办？

我正在尝试训练一个非常大的模型因此我只能将非常小的批量大小放入 GPU 内存中处理小批量的结果非常噪声梯度估计 https stackoverflow com a 33717093 1714410 我该怎么做才能避免这个问题您可以更
Caffe 的 LSTM 模块

有谁知道 Caffe 是否有一个不错的 LSTM 模块我从 russel91 的 github 帐户中找到了一个但显然包含示例和解释的网页消失了以前是http apollo deepmatter io http apollo deep
使用Python构建caffe（找不到-lboost_python3）

我正在尝试用 python 构建 caffe 但它一直这样说 CXX LD o python caffe caffe so python caffe caffe cpp usr bin ld cannot find lboost pytho

随机推荐

Multisim14.0安装教程

2 安装步骤解压打开 Multisim14 0 鼠标右击 NI Circuit Design Suite 14 0 exe 选择以管理员身份运行点击确定选择文件的解压路径最好不解压在C盘安装完成删掉即可然后点击 Unzip
华为OD机试2023(JS,C++,JAVA,PYTHON)-服务器能耗统计

本篇题解服务器耗能题目描述服务器有三种运行状态空载单任务多任务每个时间片的能耗的分别为 1 1 1 3 3 3 4 4 4 每个任务由起始时间片和结束时间片定义运行时间如果一个时间片只有一个任务需要执行则服务器处于单任
微信小程序的常见的面试题（总结）

1 微信小程序有几个文件 WXML WeiXin Markup Language 是框架设计的一套标签语言结合基础组件事件系统可以构建出页面的结构内部主要是微信自己定义的一套组件 WXSS WeiXin Style Sheets 是
Qt实现IP输入框（模仿Windows系统中的IP输入框）

本文章所用的代码整理自Qt实现IP输入框 qt中ip地址输入框 GreenArrowMan的博客 CSDN博客感谢原作者分享本代码在上述作者代码基础上做了如下修改 1 屏蔽中文输入法 2 修复原作者代码中输入框四周的黑色边线无法正常显示
【安装问题】python安装weditor出现报错总结

python安装weditor出现报错总结问题描述主要原因是公司使用的python2版本过老由于不能随意升级python版本只能在python2的基础上解决办法有很多地方需要更新总结命令如下基本上试过一遍问题就可以解决了解
深度学习源码小项目汇总-代码全

demo仓库和视频演示到此一游7758258的个人空间哔哩哔哩 bilibili 卷积网路CNN分类的模型一般使用包括alexnet DenseNet DLA GoogleNet Mobilenet ResNet ResNeXt Shu
财报解读：毛利持续改善，金山云正在“弯道超车”？

一季度云巨头们的表现持续稳健依旧稳坐前排而作为中小云代表的金山云也在5月23日发布了2023年一季度财报盈利能力持续改善成为通篇最亮眼的一笔随着AI大模型打开了新的潘多拉魔盒云市场也在发生着巨变但AI能否成为云厂商打开盈利大
JavaScript实现经典消方块游戏

操作方式在游戏区域中任意位置滑动手势点击屏幕下方的按钮键盘WASD和都可以操作游戏动作操作方块向左移动左划按下蓝色键左一 A 方块向右移动右划按下橙色键右一 D 强制方块下落下划按下粉色键左二 S 改变方块方
Learncpp___CH1

You have to write a program once to know how you should have written it the first time Short answer You don t C is one p
HTML详解连载（3）

HTML详解连载 3 专栏链接 link http t csdn cn xF0H3 下面进行专栏介绍开始喽表单作用使用场景 input标签基本使用示例 type属性值以及说明 input标签占位文本示例注意单选框 radio
报错django.db.utils.DataError: (1406, "Data too long for column 'gender' at row 1")的解决办法

参考解决方案 Traceback most recent call last File C Users rHotD AppData Local Programs Python Python35 lib site packages djang
【华为机试真题 JAVA】非严格递增连续数字序列-100

编程题目 100分非严格递增连续数字序列 2022 Q1 Q2 考试题时间限制 C C 1秒其他语言 2秒空间限制 C C 262144K 其他语言524288K 64bit IO Format lld 本题可使用本地IDE编码不
react+antd mobile实现 H5底部tab页面

1 引入底部tab页所需组件第二步创建tabs负责放入底部的页面路由第三步在return里面对tab进行配置以及引用所需的页面组件内其中 activekey 是切换tab的key值当他切换等于对应的路由是就展示对应的页面
【Java】将文本转化成语音

1 需要的jar包 2 把dll文件放在 JAVA HOME bin下注意系统是32位还是64位也可以放在C Windows System32下如果是64位应该放在C Windows SysWOW64 下 3 java代码 impor
CA2W格式化多个时需要加强制转换，CDuiString格式化也需强转

CString str str Format L s CM2W ss data str Format L s s LPCTSTR CM2W ss data LPCTSTR CM2W asdfg str Format L s LPCTSTR
基于Zynq FPGA对雷龙SD NAND的测试

文章目录一 SD NAND特征 1 1 SD卡简介 1 2 SD卡Block图二 SD卡样片三 Zynq测试平台搭建 3 1 测试流程 3 2 SOC搭建四软件搭建五测试结果六总结一 SD NAND特征 1 1 SD卡简
webpack5学习进阶：多页面应用、Tree Shaking、PWA、Shimming

文章目录一多页面应用 1 entry 配置 1 1 将两个本地文件打包在一起 1 2 还可以打包第三方库文件 1 3 多页面打包 2 index html 模板配置 3 多页面环境搭建二 Tree Shaking 摇树优化 1 配置
rocketMQ系列(一): 消息中间件及rocketMQ简介

一消息中间件介绍消息中间件是基于队列与消息传递技术在网络环境中为应用系统提供同步或异步可靠的消息传输的支撑性软件系统消息中间件利用高效可靠的消息传递机制进行平台无关的数据交流并基于数据通信来进行分布式系统的集成通过提供消息传递
什么是弱网测试?为什么要进行弱网测试?怎么进行弱网测试？

什么是弱网测试由于处在移动互联网盛行的时代网络形态除了有线连接外还有2G 3G 4G Wifi 5G等多种手机网络连接方式首先额外补充一些5G的知识 2分钟了解什么是5G 在前不久结束的 MWC 2018 上 5G 成了全球的一个热
caffe-python lmdb 读写（转）

lmdb write import lmdb import numpy as np import cv2 import caffe from caffe proto import caffe pb2 basic setting 这个设置用来

caffe-python lmdb 读写（转）

caffe-python lmdb 读写（转） 的相关文章

随机推荐

热门标签

caffe-python lmdb 读写（转）的相关文章