您可以用 Google 的 Protocol Buffer 格式表示 CSV 数据吗？

2024-05-15

我最近发现了协议缓冲区，想知道它们是否可以应用于我的特定问题。

基本上，我有一些 CSV 数据，需要将其转换为更紧凑的格式以进行存储，因为其中一些文件有几GB。

CSV中的每个字段都有一个标题，并且只有两种类型，字符串和小数（因为有时有很多有效数字，我需要以相同的方式处理所有数字）。但每个文件的每个字段都有不同的列名称。

除了捕获原始 CSV 数据之外，我还需要能够在保存之前向文件添加额外信息。我希望通过处理不同的文件版本来证明这一点。

那么，是否可以使用协议缓冲区来捕获随机数量的随机命名的数据列，例如 CSV 文件？

嗯，这当然是有代表性的。就像是：

message CsvFile {
    repeated CsvHeader header = 1;
    repeated CsvRow row = 2;
}

message CsvHeader {
    require string name = 1;
    require ColumnType type = 2;
}

enum ColumnType {
    DECIMAL = 1;
    STRING = 2;
}

message CsvRow {
    repeated CsvValue value = 1;
}

// Note that the column is implicit based on position within row    
message CsvValue {
    optional string string_value = 1;
    optional Decimal decimal_value = 2;
}

message Decimal {
    // However you want to represent it (there are various options here)
}

我不确定它会提供多少好处，请注意...您当然可以添加更多信息（添加到 CsvFile 消息），并且未来的校对采用“正常 PB 方式” - 仅添加可选字段等。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

serialization

csv

protocolbuffers

您可以用 Google 的 Protocol Buffer 格式表示 CSV 数据吗？的相关文章

Grpc - 将消息从一个客户端发送到连接到同一服务器的另一个客户端

是否可以将消息从一个客户端发送到连接到同一服务器的另一个客户端我想将数据从一个客户端发送到服务器然后发送到特定客户端我想我需要获取客户端 ID 但我不知道如何获取此 ID 以及如何从服务器将此消息发送到该客户端我这里有一个样本这是一
MVC3中设置下拉列表中的所选项目

我必须为视图中的下拉列表设置所选项目但它不起作用 View div class editor label Html LabelFor model gt model Gender div div class editor field Htm
java中如何重新初始化int数组

class PassingRefByVal static void Change int pArray pArray 0 888 This change affects the original element pArray new int
即使没有异步，CallContext.LogicalGetData 也会恢复。为什么？

我注意到CallContext LogicalSetData LogicalGetData不按照我期望的方式工作内部设置的值async方法得到恢复即使没有异步或任何类型的线程切换无论如何这是一个简单的例子 using System u
Eigen 和 OpenMP：由于错误共享和线程开销而没有并行化

系统规格 Intel Xeon E7 v3 处理器 4 插槽 16 核插槽 2 线程核心 Eigen 系列和 C 的使用以下是代码片段的串行实现 Eigen VectorXd get Row const int j const int
如何使用 ASP.NET Core 获取其他用户的声明

我仍在学习 ASP NET Core 的身份我正在进行基于声明的令牌授权大多数示例都是关于当前登录用户的就我而言我的 RPC 服务正在接收身份数据库中某个用户的用户名和密码我需要验证是否存在具有此类凭据的用户获取该用户的所
在 VS 中运行时如何查看 C# 控制台程序的输出？

我刚刚编写了一个名为 helloworld 的聪明程序它是一个 C NET 4 5 控制台应用程序在扭曲的嵌套逻辑迷宫深处使用了 Console WriteLine 当我在命令行运行它时它会运行并且我会看到输出我可以执行其他命令并
如何使用 x64 运行 cl？

我遇到了和这里同样的问题致命错误 C1034 windows h 未设置包含路径 https stackoverflow com questions 931652 fatal error c1034 windows h no include
在 .NET MAUI 中实现 TouchTracking

我一直致力于将我们的应用程序从 Xamarin Forms 迁移到 NET MAUI 我们的应用程序几乎没有绘图功能用户可以用手指进行绘图我们用了TouchTrackingXamarin Forms 中的 nuget 包但与 NET
如何递归取消引用指针（C++03）？

我正在尝试在 C 中递归地取消引用指针如果传递一个对象那就是not一个指针这包括智能指针我只想返回对象本身如果可能的话通过引用返回我有这个代码 template
不可变类与结构

以下是类与 C 中的结构的唯一区别如果我错了请纠正我类变量是引用而结构变量是值因此在赋值和参数传递中复制结构的整个值类变量是存储在堆栈上的指针指向堆上的内存而结构变量作为值存储在堆上假设我有一个不可变的结构该结构的字段一
模板外部链接？谁能解释一下吗？

模板名称具有链接 3 5 非成员函数模板可以有内部链接任何其他模板名称应具有外部链接从具有内部链接的模板生成的实体与在其他翻译单元中生成的所有实体不同我知道使用关键字的外部链接 extern C EX extern C templat
将二变量 std::function 转换为单变量 std::function

我有一个函数它获取两个值 x 和 y 并返回结果 std function lt double double double gt mult double x double y return x y 现在我想得到一个常量 y 的单变量函数
将 Word 转换为 PDF - 禁用“保存”对话框

我有一个用 C 编写的 Word 到 PDF 转换器除了一件事之外它工作得很好有时在某些 Word 文件上后台会出现一条消息保存源文件中的更改 gt 是否取消但我没有对源文件进行任何更改我只想从 Word 文件创建 PDF
将函数参数类型提取为参数包

这是一个后续问题解包元组以调用匹配的函数指针 https stackoverflow com questions 7858817 unpacking a tuple to call a matching function pointer
代码中的.net Access Forms身份验证“超时”值

我正在向我的应用程序添加注销过期警报并希望从我的代码访问我的 web config 表单身份验证超时值我有什么办法可以做到这一点吗我认为您可以从 FormsAuthentication 静态类方法中读取它这比直接读取 web c
如何在 sql azure 上运行 aspnet_regsql？ [复制]

这个问题在这里已经有答案了可能的重复将 ASP NET 成员资格数据库迁移到 SQL Azure https stackoverflow com questions 10140774 migrating asp net membersh
在 System.Type 上使用条件断点时出错

这是函数 public void Init System Type Type this Type Type BuildFieldAttributes BuildDataColumns FieldAttributes 我在第一行设置了一个断点
我可以使用 lambda 函数或 std::function 对象来代替函数指针吗？

我有一个需要使用的库它定义了以下内容 typedef void CallbackFunction const int i 并且有一个注册回调的函数如下所示 void registerCallback CallbackFunction p
如何在 C 中将 char 连接到 char* ？

我怎样才能前置char c to char myChar 我有c值为 A and myChar值为 LL 我怎样才能前置c to myChar使 ALL 这应该有效 include

随机推荐

用reduce es6替换filter和map

我试图避免与过滤器和映射链接但为什么我的reduce 返回未定义 const data value moto passed true value boat passed false value car passed true expect
为什么我的 PHP 脚本无法对其创建的文件进行 chmod？

我有一个 php 创建一个需要可执行的文件它是一个需要由系统运行的批处理文件由于某种原因即使该文件归 apache 所有并且 php 作为 apache 运行并且创建了该文件该脚本还是在 chmod 行处终止我需要进行哪些不同配
vs-code：无法在内置终端上反向搜索

当我做 R在终端上进行反向搜索我得到以下信息 R was pressed Waiting for second key of chord 我该如何解决我在 OS X 上另请参阅运行最近的命令作为反向搜索的替代 https github
Android 从 C++ 端播放原始音频

我需要能够在 Android 系统的 C 端以自定义文件格式传输音频我正在致力于移植自定义媒体播放器并且需要能够打开自定义文件并从中传输音频这很重要因为我认为从性能角度来看将整个播放器移植到 JAVA 是不可行的并且通过 JNI
PHP中的反转数组

array 7 0 gt array 2 id gt string 1 9 roi gt float 0 1 gt array 2 id gt string 1 1 roi gt float 0 2 gt array 2 id gt str
如何解决注意：未定义索引：第 21 行 C:\xampp\htdocs\invmgt\manufactured_goods\change.php 中的 id [重复]

这个问题在这里已经有答案了我的 PHP 代码有一个问题显示注意未定义的索引我确信它非常简单因为我是初学者所以我不太清楚到底出了什么问题所以请帮助我这是代码
获取一组记录之间的时间差

我有一个具有以下结构的表 ID ActivityTime Status 19 2013 08 23 14 52 1 19 2013 08 23 14 50 1 19 2013 08 23 14 45 2 19 2013 08 23 14 3
IF EXISTS 在德比中未被识别

DROP TABLE IF EXISTS Pose 结果出现错误 Error code 1 SQL state 42X01 Syntax error Encountered EXISTS at line 1 column 15 我使用默认的
生成所有多集大小为 n 的分区的算法

我一直在试图找出一种方法来生成多重集的所有不同的大小为 n 的分区但到目前为止却空手而归首先让我展示一下我想要实现的目标假设我们有一个输入向量uint32 t std vector
如何从 android.googlesource.com 或 github.com 下载单个目录？

我想下载 https android googlesource com platform frameworks base git master tools aapt https android googlesource com platfo
TinyMCE 脏标志未设置或在编辑器离开后自动重置？

配置 TinyMce 编辑器和一些功能后如果用户进行了更改但没有保存我现在想警告用户为此我正在检查 Blur 的脏标志但它总是被设定的false 控制器 js this scope tinymceOptions selector
如何在由子控件组成的 SWT 复合材料上跟踪鼠标？

我创建了自己的控件我想跟踪鼠标并添加一个MouseTrackListener 很遗憾MouseEnter and MouseLeave当鼠标移动到我的合成部分即标签和按钮上时也会生成事件 Mouse enter mouse ente
malloc：***错误：已释放对象的校验和不正确 - 对象可能在释放后被修改

我的 iOS 应用程序有一个大问题它有时会崩溃而没有详细的调试错误堆栈跟踪为空这是堆栈跟踪中仅有的两行 UIApplicationMain 中的符号存根 UIHostedTextServiceSession DismissText
使用 JavaScript 更改 HTML 内的日期格式

我在页面上有以下代码 span class release date i class fa fa calendar i 2014 11 16 span This 2014 11 16是日期由我的 CMS 自动生成我需要更改这个日期基本
使用 Turbo C 编译并链接到 .com 文件

我正在尝试使用 Turbo C 编译器和链接器编译一个简单的程序并将其链接到 DOS com 文件我尝试了我能想到的最简单的 C 程序 void main Turbo C 链接器中是否有链接到 com 文件的命令行参数我从链接器收到的错
使用AJAX通过WebApi调用Delete方法

我在 ASP Net Web 应用程序中使用 WebApi 我在控制器中有一个名为Delete我想通过使用 jQuery 的 AJAX 方法来访问此方法下面是我的代码 Authorize public int Delete int pro
有没有创建 Cron 表达式的 Java 代码？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我需要一个 Java 代码来根据用户输入创建一个 cron 表达式用户输入是时间频率和执行次数只需从评论中添加自己创建即可
如何编写 Perl 脚本来使用 curl 处理 URL？

我有一个非常简单的任务我有一个 crontab 每小时运行一个脚本该脚本旨在简单地处理 URL 这就是我所拥有的这不起作用我收到语法错误 usr bin perl curl http domain com page html 我已经
ASP.net C#.如何解析博客中的原子提要

饲料位于 http latestpackagingnews blogspot com feeds posts default http latestpackagingnews blogspot com feeds posts default
您可以用 Google 的 Protocol Buffer 格式表示 CSV 数据吗？

我最近发现了协议缓冲区想知道它们是否可以应用于我的特定问题基本上我有一些 CSV 数据需要将其转换为更紧凑的格式以进行存储因为其中一些文件有几GB CSV中的每个字段都有一个标题并且只有两种类型字符串和小数因为有时有很多有效

您可以用 Google 的 Protocol Buffer 格式表示 CSV 数据吗？

您可以用 Google 的 Protocol Buffer 格式表示 CSV 数据吗？ 的相关文章

随机推荐

热门标签

您可以用 Google 的 Protocol Buffer 格式表示 CSV 数据吗？的相关文章