Window下用caffe实现MNIST训练

2023-11-19

本博包含MNIST原始数据的格式转化，以及分类训练

1.数据转化

Caffe源码中src/caffe/caffe/examples/mnist/convert_mnist_data.cpp提供的实现代码并不能直接在Windows下运行，这里在源码的基础上进行了改写，使其可以直接在Windows 64位上直接运行，改写代码如下（直接替换convert_mnist_data.cpp中所有内容）：

PS1：蓝色字体部分需要根据你自己的实际路径进行修改

PS2：目前该程序一次只能处理train集或者test集中的一个，下方代码是处理test集的，处理train集的时候需要把蓝色路径改为train集的路径。

#include <gflags/gflags.h>  
#include <glog/logging.h>  
#include <google/protobuf/text_format.h>  
#include <leveldb/db.h>  
#include <leveldb/write_batch.h>  
#include <lmdb.h>  
#include <stdint.h>  
#include <sys/stat.h>  

#include <fstream>  // NOLINT(readability/streams)  
#include <string>  
#include <iostream>  

#include "caffe/proto/caffe.pb.h"  

using namespace caffe;  // NOLINT(build/namespaces)  
using std::string;

// gflags中的数据类型，c++ string，在这里指定转换到lmdb还是leveldb  
DEFINE_string(backend, "lmdb", "The backend for storing the result");

uint32_t swap_endian(uint32_t val) {
	val = ((val << 8) & 0xFF00FF00) | ((val >> 8) & 0xFF00FF);
	return (val << 16) | (val >> 16);
}

void convert_dataset(const char* image_filename, const char* label_filename,
	const char* db_path, const string& db_backend) {
	// Open files  
	std::ifstream image_file(image_filename, std::ios::in | std::ios::binary);
	std::ifstream label_file(label_filename, std::ios::in | std::ios::binary);
	CHECK(image_file) << "Unable to open file " << image_filename;
	CHECK(label_file) << "Unable to open file " << label_filename;
	// Read the magic and the meta data  
	uint32_t magic;
	uint32_t num_items;
	uint32_t num_labels;
	uint32_t rows;
	uint32_t cols;

	// 读取文件前n个字节，获取图像数量、图像宽、图像高  
	image_file.read(reinterpret_cast<char*>(&magic), 4);
	magic = swap_endian(magic);
	CHECK_EQ(magic, 2051) << "Incorrect image file magic.";
	label_file.read(reinterpret_cast<char*>(&magic), 4);
	magic = swap_endian(magic);
	CHECK_EQ(magic, 2049) << "Incorrect label file magic.";
	image_file.read(reinterpret_cast<char*>(&num_items), 4);
	num_items = swap_endian(num_items);
	label_file.read(reinterpret_cast<char*>(&num_labels), 4);
	num_labels = swap_endian(num_labels);
	CHECK_EQ(num_items, num_labels);
	image_file.read(reinterpret_cast<char*>(&rows), 4);
	rows = swap_endian(rows);
	image_file.read(reinterpret_cast<char*>(&cols), 4);
	cols = swap_endian(cols);

	// lmdb  
	MDB_env *mdb_env;
	MDB_dbi mdb_dbi;
	MDB_val mdb_key, mdb_data;
	MDB_txn *mdb_txn;
	// leveldb  
	leveldb::DB* db = NULL;
	leveldb::Options options;
	options.error_if_exists = true;
	options.create_if_missing = true;
	options.write_buffer_size = 268435456;
	leveldb::WriteBatch* batch = NULL;

	// Open db  
	if (db_backend == "leveldb") {  // leveldb  
		LOG(INFO) << "Opening leveldb " << db_path;
		leveldb::Status status = leveldb::DB::Open(
			options, db_path, &db);
		CHECK(status.ok()) << "Failed to open leveldb " << db_path
			<< ". Is it already existing?";
		batch = new leveldb::WriteBatch();
	}
	else if (db_backend == "lmdb") {  // lmdb  
		int rc;
		LOG(INFO) << "Opening lmdb " << db_path;
		// 创建指定的存放目录  
		//CHECK_EQ(mkdir(db_path, 0744), 0)  
		std::string strPath = std::string(db_path);
		std::string delPath = "rmdir /s/q " + strPath;
		system(delPath.c_str());
		strPath = "mkdir " + strPath;
		system(strPath.c_str());
		//CHECK_EQ(system(strPath.c_str()), 0) << "mkdir " << db_path << "failed";  

		// 创建lmdb数据库  
		CHECK_EQ(mdb_env_create(&mdb_env), MDB_SUCCESS) << "mdb_env_create failed";
		//CHECK_EQ(mdb_env_set_mapsize(mdb_env, 1099511627776), MDB_SUCCESS) << "mdb_env_set_mapsize failed";//1TB  
		CHECK_EQ(mdb_env_set_mapsize(mdb_env, 107374182), MDB_SUCCESS) << "mdb_env_set_mapsize failed";//100MB  
		CHECK_EQ(mdb_env_open(mdb_env, db_path, 0, 0664), MDB_SUCCESS) << "mdb_env_open failed";
		CHECK_EQ(mdb_txn_begin(mdb_env, NULL, 0, &mdb_txn), MDB_SUCCESS) << "mdb_txn_begin failed";
		CHECK_EQ(mdb_open(mdb_txn, NULL, 0, &mdb_dbi), MDB_SUCCESS) << "mdb_open failed. Does the lmdb already exist? ";
	}
	else {
		LOG(FATAL) << "Unknown db backend " << db_backend;
	}

	// Storing to db  
	char label;
	char* pixels = new char[rows * cols];
	int count = 0;
	const int kMaxKeyLength = 10;
	char key_cstr[kMaxKeyLength];
	string value;

	Datum datum; // Caffe数据类  
	datum.set_channels(1);
	datum.set_height(rows);
	datum.set_width(cols);
	LOG(INFO) << "A total of " << num_items << " items.";
	LOG(INFO) << "Rows: " << rows << " Cols: " << cols;
	// 将数据写入lmdb或leveldb数据库  
	for (int item_id = 0; item_id < num_items; ++item_id) {
		image_file.read(pixels, rows * cols);
		label_file.read(&label, 1);
		datum.set_data(pixels, rows*cols);
		datum.set_label(label);
		//snprintf(key_cstr, kMaxKeyLength, "%08d", item_id);  
		int ret = _snprintf(key_cstr, kMaxKeyLength, "%08d", item_id);
		if (ret == kMaxKeyLength || ret < 0) {
			printf("warning ");
			key_cstr[kMaxKeyLength - 1] = 0;
		}
		datum.SerializeToString(&value);
		string keystr(key_cstr);

		// Put in db  
		if (db_backend == "leveldb") {  // leveldb  
			batch->Put(keystr, value);
		}
		else if (db_backend == "lmdb") {  // lmdb  
			mdb_data.mv_size = value.size();
			mdb_data.mv_data = reinterpret_cast<void*>(&value[0]);
			mdb_key.mv_size = keystr.size();
			mdb_key.mv_data = reinterpret_cast<void*>(&keystr[0]);
			CHECK_EQ(mdb_put(mdb_txn, mdb_dbi, &mdb_key, &mdb_data, 0), MDB_SUCCESS)
				<< "mdb_put failed";
		}
		else {
			LOG(FATAL) << "Unknown db backend " << db_backend;
		}

		if (++count % 1000 == 0) {
			// Commit txn  
			if (db_backend == "leveldb") {  // leveldb  
				db->Write(leveldb::WriteOptions(), batch);
				delete batch;
				batch = new leveldb::WriteBatch();
			}
			else if (db_backend == "lmdb") {  // lmdb  
				CHECK_EQ(mdb_txn_commit(mdb_txn), MDB_SUCCESS)
					<< "mdb_txn_commit failed";
				CHECK_EQ(mdb_txn_begin(mdb_env, NULL, 0, &mdb_txn), MDB_SUCCESS)
					<< "mdb_txn_begin failed";
			}
			else {
				LOG(FATAL) << "Unknown db backend " << db_backend;
			}
		}
	}
	// write the last batch  
	if (count % 1000 != 0) {
		if (db_backend == "leveldb") {  // leveldb  
			db->Write(leveldb::WriteOptions(), batch);
			delete batch;
			delete db;
		}
		else if (db_backend == "lmdb") {  // lmdb  
			CHECK_EQ(mdb_txn_commit(mdb_txn), MDB_SUCCESS) << "mdb_txn_commit failed";
			mdb_close(mdb_env, mdb_dbi);
			mdb_env_close(mdb_env);
		}
		else {
			LOG(FATAL) << "Unknown db backend " << db_backend;
		}
		LOG(ERROR) << "Processed " << count << " files.";
	}
	delete[] pixels;
}

int main(int argc, char* argv[])
{
#ifndef GFLAGS_GFLAGS_H_  
	namespace gflags = google;
#endif  
	argc = 4;
#ifdef _DEBUG  
	argv[0] = "D:/Caffe/caffe-windows/Build/x64/Debug/convert_imageset.exe";
#else  
	argv[0] = "D:/Caffe/caffe-windows/Build/x64/Release/convert_imageset.exe";
#endif  
	argv[1] = "D:/Caffe/caffe-windows/Build/x64/Release/MNIST/t10k-images.idx3-ubyte";
	argv[2] = "D:/Caffe/caffe-windows/Build/x64/Release/MNIST/t10k-labels.idx1-ubyte";
	argv[3] = "D:\\Caffe\\caffe-windows\\Build\\x64\\Release\\MNIST\\lmdb\\test";

	// 用来设定usage说明  
	gflags::SetUsageMessage("This script converts the MNIST dataset to\n"
		"the lmdb/leveldb format used by Caffe to load data.\n"
		"Usage:\n"
		"    convert_mnist_data [FLAGS] input_image_file input_label_file "
		"output_db_file\n"
		"The MNIST dataset could be downloaded at\n"
		"    http://yann.lecun.com/exdb/mnist/\n"
		"You should gunzip them after downloading,"
		"or directly use data/mnist/get_mnist.sh\n");
	// 解析命令行参数  
	gflags::ParseCommandLineFlags(&argc, &argv, true);

	// 获取标志参数backend的值  
	const string& db_backend = FLAGS_backend;

	if (argc != 4) {
		// 输出usage说明  
		gflags::ShowUsageWithFlagsRestrict(argv[0],
			"examples/mnist/convert_mnist_data");
	}
	else {
		// 设置日志文件名中"文件名"字段  
		// 每个进程中至少要执行一次InitGoogleLogging，否则不产生日志文件  
		google::InitGoogleLogging(argv[0]);
		convert_dataset(argv[1], argv[2], argv[3], db_backend);
	}

	std::cout << "ok!" << std::endl;
	return 0;
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

caffe

Window下用caffe实现MNIST训练的相关文章

Caffe源码中caffe.proto文件分析

Caffe源码 caffe version 09868ac date 2015 08 15 中有一些重要文件这里介绍下caffe proto文件在src caffe proto目录下有一个caffe proto文件 proto目录下除了
Sigaction 并将 Linux 代码移植到 Windows

我正在尝试移植caffe 针对Linux开发源代码到Windows环境问题在于sigaction结构在signal handler cpp and signal handler h 源代码如下所示我的疑问是可以替换哪个库或代码来实现此
谷歌 Deep Dream 艺术：如何在神经网络中选择一个层并对其进行增强

我对 Google 最近发表的一篇博客文章感兴趣该文章描述了nn创造艺术我对一项技术特别感兴趣在这种情况下我们只需向网络提供任意图像或照片然后让网络分析该图片然后我们选择一个层并要求网络增强它检测到的任何内容网络的每一层都处理
Tensorflow的非对称填充假设

为什么 TensorFlow 选择在右下角填充 With SAME填充对我来说在第一个真实像素处启动内核的中心锚点是合乎逻辑的由于使用了不对称填充这导致与其他一些框架存在差异我确实明白原则上不对称填充是好的因为否则会留下未使用
如何将 .npy 文件转换为 .binaryproto？

我使用 python 创建了一个平均图像文件并将其保存到 numpy 文件中我想知道如何将此 npy 文件转换为 binaryproto 文件我正在使用此文件来使用 GoogLeNet 进行训练您可以简单地使用 numpy 创建 bi
在哪里可以找到经过训练的模型（例如 googleNet 的输出）与真实类别标签之间的标签映射？

大家好我是咖啡新手目前我尝试使用从 model Zoo 下载的经过训练的 GoogleNet 对一些图像进行分类然而网络的输出似乎是一个向量而不是真正的标签如狗猫在哪里可以找到经过训练的模型例如 googleNet 的输出
检查失败：mdb_status == 0 (2 vs. 0) 没有这样的文件或目录

我在训练数据时收到以下错误我已经尝试了互联网上给出的所有解决方案但似乎没有一个对我有用我已检查 lmdb 文件的路径和大小不为零但问题仍然存在我不知道如何解决这个问题 pooling I0411 12 42 53 114141 2
如何在caffe中将多个N维数组输入到网络中？

我想在 caffe 中创建一个用于语义分割的自定义损失层需要多个输入我希望这个损失函数有一个额外的输入因子以惩罚小物体的漏检为此我创建了一个图像 GT 其中每个像素都包含一个权重如果像素属于小物体则权重较高我是 caffe
Caffe 训练/测试网络输出是什么意思？

在 Caffe 中训练时每次迭代都有训练和测试网络输出我知道这就是损失但是这是我批次的平均损失还是总损失这对于分类和回归来说是一样的吗例如如果我有一批 100 个训练示例并且该迭代的损失为 100 这是否意味着每个示例的平均
Caffe 模型为每个图像提供相同的输出

我刚刚使用预定义的 prototxt 和 caffemodel 文件在 caffe 中加载了 alexnet 然而将任何图像发送到模型都会返回与 fc7 层的输出相同的值这是代码片段 net caffe Net alexnet trai
Caffe 中的“lr_policy”是什么？

我只是想知道如何使用Caffe http caffe berkeleyvision org 为此我只是看看不同的 prototxt示例文件夹中的文件有一个选项我不明白 The learning rate policy lr policy
LMDB 文件以及它们如何用于 caffe 深度学习网络

我对深度学习很陌生在使用 caffe 深度学习网络时遇到一些问题基本上我没有找到任何文档来解释如何解决我现在正在处理的一系列问题请让我先解释一下我的情况我有数千张图像我必须对它们进行一系列预处理操作对于每个预处理操作我必须将
Caffe：如何通过代码获取`solver.prototxt`参数？

我想访问solver prototxt参数如base lr 基础学习率或weight decay来自Python代码有什么方法可以从solver net目的谢谢根据本教程 http nbviewer jupyter org gith
Caffe 快照：.solverstate 与 .caffemodel

训练网络时每 N 次迭代拍摄的快照有两种形式一个是 solverstate 文件我想它就像它听起来的那样存储损失函数和梯度的状态等另一个是 caffemodel 文件我知道它存储训练后的参数如果您想要预训练的模型 caffem
由于 gcc 编译器版本不受支持，Caffe 编译失败

我挣扎着Caffe http caffe berkeleyvision org 汇编不幸的是我没能编译它 Steps http caffe berkeleyvision org installation html cmake compil
Caffe net.predict() 输出随机结果 (GoogleNet)

我使用了预训练的 GoogleNethttps github com BVLC caffe tree master models bvlc googlenet https github com BVLC caffe tree master
如何在 pycaffe 中获取图层类型？

是否有可能在 pycaffe 中获取每一层的类型例如卷积数据等我搜索了提供的示例但找不到任何内容目前我正在使用图层名称来完成我的工作这是非常糟糕和有限的这很容易 import caffe net caffe Net path
如何加载 caffe 模型并转换为 numpy 数组？

我有一个 caffemodel 文件其中包含 ethereon 的 caffe tensorflow 转换实用程序不支持的层我想生成我的咖啡模型的 numpy 表示我的问题是如何将 caffemodel 文件我还有 prototx
如何在 Caffe 的网络中出现多次损失？

如果我在网络中定义多个损失层从这些末端到网络的开头是否会发生多个反向传播我的意思是他们真的是这样工作的吗假设我有这样的事情 Layer1 Layer2 Layer n Layer cls1 bottom layer n top cl
caffe reshape / 上采样全连接层

假设我们有一个像这样的层 layer name fully connected type InnerProduct bottom bottom top top inner product param num output 1 输出是batc

随机推荐

【Python网络蜘蛛】：基础 - HTTP基本原理

文章目录 1 1 HTTP基本原理 1 URI和URL 2 HTTP和HTTPS 3 HTTP请求过程 4 请求 5 响应 1 1 HTTP基本原理 1 URI和URL URI为统一资源标识符 URL为统一资源定位符举个例子理解 http
最简单的方式来理解阻抗、反射和端接

1 阻抗失配与反射在深入学习电磁场之后就觉得高中物理老师不应该用水流来比喻电流结果到了自己去和别人讲阻抗反射发现用水来做比喻还是很方便轻松的所以之前在电源滤波的系列文章中高速先生就多次请水来友情出演这不欢迎我们的水小
Simulink仿真模型中的常数符号赋值

对模型中的参数或者是常数符号赋值可以通过下面两种方法在MATLAB的命令行中直接赋值然后再运行仿真模型如下图在file gt model properties的initFcn 中进行设置
AI芯片，是噱头还是趋势？

随着AlphaGo的诞生深度学习日益普及人工智能开始从智能化工具向智能机器进军原有的MCU已无法满足深度学习的高速海量数据运算要求 AI芯片便应运而生如今嵌入式芯片领域正面临AI芯片的新一轮机遇那么在AI成为风口的当下 AI芯片
2022年高级性能测试岗面试题【面试必看】

昨天一个前同事找我问有没有性能测试岗位的面试题正好之前帮业务团队加面过几次性能测试岗位的候选人我将面试时候会问的一些问题以及要考察的点列了出来供大家参考一介绍下最近做过的项目背景预期指标系统架构场景设计及遇到的性能问题
oobabooga-text-generation-webui可能是最好的语言模型启动器（包含手把手安装教程）

原文 oobabooga text generation webui可能是最好的语言模型启动器包含手把手安装教程哔哩哔哩引言问 oobabooga是什么 oobabooga text generation webui是一个用于运行类
HeadFirst 设计模式学习笔记10——MVC分析

1 M V C Model View Controller 模式视图控制器这是一种范型模型对象正是应用系统存在的理由你设计的对象包含了数据逻辑和其他在你的应用领域创建定制的类视图通常是控件用来显示和编辑控制器位于二者中间
3.3 C++多继承与虚基类

书接上回继承存在二义性上图中 A是虚基类 virtual的继承方式就是虚继承参考下文章 C 虚继承和虚基类详解知乎 zhihu com
apache和iis文件解析漏洞原理及修复

Apache文件解析漏洞是指攻击者可以利用Apache服务器的文件解析功能通过构造特殊的URL 访问服务器上的敏感文件从而获取服务器上的敏感信息 IIS文件解析漏洞是指攻击者可以利用IIS服务器的文件解析功能通过构造特殊的URL 访问
面试官：如何用a标签实现文件下载？（一文带你手撕知识点）

前言大家好今天给大家带来前端小知识前端利用a标签实现文件图片下载也就是教大家利用a标签或者是 window open 来实现下载功能文章目录前言常用方式方法分析代码实现常用方式 a href url 下载 a a标签
Weex简介及环境搭建(mac版)

1 Weex简介及特点 weex 是一个使用 Web 开发体验来开发高性能原生应用的框架在Ios和Android上都实现了一个渲染引擎并提供了一套基础的内置组件渲染出来的都是原生组件提供了一套基础的内置模块可以通过这些模块来调用一
校园网服务器系统需求分析,校园网建设需求分析.doc

校园网建设需求分析校园网建设需求分析文档日期2012 5 9编号002项目名称北京市信息职业技术学院东校区校园网建设项目部门网建部开始时间2012 5 9结束时间2012 5 文档名称北京市信息职业技术学院东校区校园网建设项目需求分析文
放弃Dubbo，选择最流行的Spring Cloud微服务架构实践与经验总结

51CTO com原创稿件 Spring Cloud 在国内中小型公司能用起来吗从 2016 年初一直到现在我们在这条路上已经走了一年多在使用 Spring Cloud 之前我们对微服务实践是没有太多的体会和经验的从最初的开源软件
uniapp git忽略unpackage文件

最近在写整理一个app框架遇到git提交时unpackage文件无法忽略的问题 1 第一反应是创建 gitignore文件并写入unpackage目录本以为大功告成奈何还是不行思考可能是由于该文件已经被提交过处于被跟踪状态所
opencv安装教程python3.8_Python3.8 安装 OpenCV 库

我是 Python 小新本文演示如何在 Windows 10 下为 Python 安装 OpenCV 库事实上借助于强大的包管理工具 pip 只需要一条安装命令就可搞定打开命令提示符输入如下命令 pip install openc
Openframework在VS2010中的配置

Openframework在VS2010中的配置首先去官网下载Openframework 下载后最好解压到C盘根目录下不然会出现各种问题我也不知道怎么解决随便打开其中的例程然后右击该工程选择属性如下图接着在C C 常规选项里
基于MATLAB的WSN网络时间同步仿真

目录 1 算法概述 2 仿真效果 3 matlab仿真源码 1 算法概述 WSN时间同步时钟偏移与同步问题主讲教师马小林 1 时钟偏移与同步问题 1 时钟偏移与同步问题时钟偏移时钟之间的时间差 Clock Offset WSN系统
【王道·计算机网络】第一章计算机网络基本体系

一计算机网络概述 1 概念计算机网络是一个将分散的具有独立功能的计算机系统通过通信设备与线路连接起来由功能完善的软件实现资源共享和信息传递的系统简而言之计算机网络就是一些互联的通过通信链路互联互通自治的计算机系统的集合 2
pycharm：Updating Indices 解决办法

pycharm Updating Indices 解决办法右下角一直在update 然后我的文件夹里面文件很多都是图片流 pycharm相当于预加载这些然后在左侧可以查看但是这个过程比较慢解决的方法是让pycharm直接无视某些文
Window下用caffe实现MNIST训练

本博包含MNIST原始数据的格式转化以及分类训练 1 数据转化 Caffe源码中src caffe caffe examples mnist convert mnist data cpp提供的实现代码并不能直接在Windows下运行这里

Window下用caffe实现MNIST训练

Window下用caffe实现MNIST训练 的相关文章

随机推荐

热门标签

Window下用caffe实现MNIST训练的相关文章