从客户端读取文本文件并在客户端上超出了javascript中单个字符串的最大大小

2023-12-12

我想反转在 javascript 中在客户端上执行的以下步骤，但在处理 blob 时遇到了问题。

在 indexedDB 数据库中，在对象存储索引上打开的游标上：

从数据库中提取数据对象。
使用 JSON.stringify 将对象转换为字符串。
创建 JSON 字符串的新 blob { type: 'text/csv' }。
将 blob 写入数组。
将光标向下移动一位并从步骤 1 开始重复。

事务成功完成后，将从 Blob 数组中生成相同类型的新 Blob。

这样做的原因是 JSON 字符串的串联超出了单个字符串允许的最大大小；因此，无法首先连接并形成一个大字符串的一团。但是，Blob 数组可以制作成更大大小（大约 350MB）的单个 Blob，并下载到客户端磁盘。

为了反转这个过程，我想我可以读入 blob，然后将其分割成组件 blob，然后将每个 blob 作为字符串读取；但我不知道该怎么做。

如果 FileReader 作为文本读取，则结果是一大块文本，无法写入单个变量，因为它超出了最大大小并引发分配大小溢出错误。

看来将文件作为数组缓冲区读取是一种允许将 blob 切成碎片的方法，但似乎存在某种编码问题。

有没有办法按原样反转原始过程，或者可以添加编码步骤以允许将数组缓冲区转换回原始字符串？

我尝试阅读一些似乎相关的问题，但此时我不明白他们正在讨论的编码问题。看来恢复字符串是相当复杂的。

感谢您提供的任何指导。

采用接受的答案后的附加信息

下面发布的代码当然没有什么特别的，但我想我应该把它分享给那些和我一样陌生的人。这是集成到 asnyc 函数中的公认答案，用于读取 blob、解析它们并将它们写入数据库。

此方法使用很少的内存。遗憾的是没有办法将数据写入磁盘。将数据库写入磁盘时，内存使用量会随着大 blob 的生成而增加，并在下载完成后不久释放。使用此方法从本地磁盘上传文件似乎可以工作，而无需在切片之前将整个 blob 加载到内存中。就好像文件是从磁盘中分片读取的。因此，它在内存使用方面非常有效。

就我的具体情况而言，仍有工作要做，因为使用此方法将总计 350MB 的 50,000 个 JSON 字符串写入数据库相当慢，大约需要 7:30 才能完成。

现在，每个单独的字符串都被单独切片，作为文本读取，并在单个事务中写入数据库。将 blob 切成由一组 JSON 字符串组成的更大块，将它们作为块中的文本读取，然后在单个事务中将它们写入数据库，是否会执行得更快，同时仍然不使用大量内存，这是一个问题我需要尝试一个单独问题的主题。

如果使用替代循环来确定填充大小 const c 所需的 JSON 字符串数量，然后对该大小的 blob 进行切片，将其作为文本读取，并将其拆分以解析每个单独的 JSON 字符串，则完成时间约为 1 :30（对于 c =250,000 至 1,000,000）。无论如何，解析大量 JSON 字符串似乎仍然会减慢速度。大 blob 切片不会转换为作为单个块解析的大量文本，并且 50,000 个字符串中的每一个都需要单独解析。

   try

     {

       let i, l, b, result, map, p;

       const c = 1000000;


       // First get the file map from front of blob/file.

       // Read first ten characters to get length of map JSON string.

       b = new Blob( [ f.slice(0,10) ], { type: 'text/csv' } ); 

       result = await read_file( b );

       l = parseInt(result.value);


       // Read the map string and parse to array of objects.

       b = new Blob( [ f.slice( 10, 10 + l) ], { type: 'text/csv' } ); 

       result = await read_file( b );

       map = JSON.parse(result.value); 


       l = map.length;

       p = 10 + result.value.length;


       // Using this loop taks about 7:30 to complete.

       for ( i = 1; i < l; i++ )

         {

           b = new Blob( [ f.slice( p, p + map[i].l ) ], { type: 'text/csv' } ); 

           result = await read_file( b ); // FileReader wrapped in a promise.

           result = await write_qst( JSON.parse( result.value ) ); // Database transaction wrapped in a promise.

           p = p + map[i].l;

           $("#msg").text( result );

         }; // next i


       $("#msg").text( "Successfully wrote all data to the database." );


       i = l = b = result = map = p = null;

     }

   catch(e)

     { 

       alert( "error " + e );

     }

   finally

     {

       f = null;

     }



/* 

  // Alternative loop that completes in about 1:30 versus 7:30 for above loop.


       for ( i = 1; i < l; i++ )

         { 

           let status = false, 

               k, j, n = 0, x = 0, 

               L = map[i].l,

               a_parse = [];



           if ( L < c ) status = true;

           while ( status )

             {

               if ( i+1 < l && L + map[i+1].l <= c ) 

                 {

                   L = L + map[i+1].l;

                   i = i + 1;

                   n = n + 1;

                 }

               else

                 {

                   status = false;

                 };

             }; // loop while


           b = new Blob( [ f.slice( p, p + L ) ], { type: 'text/csv' } ); 

           result = await read_file( b ); 

           j = i - n; 

           for ( k = j; k <= i; k++ )

             {

                a_parse.push( JSON.parse( result.value.substring( x, x + map[k].l ) ) );

                x = x + map[k].l;

             }; // next k

           result = await write_qst_grp( a_parse, i + ' of ' + l );

           p = p + L;

           $("#msg").text( result );

         }; // next i



*/



/*

// Was using this loop when thought the concern may be that the JSON strings were too large,
// but then realized the issue in my case is the opposite one of having 50,000 JSON strings of smaller size.

       for ( i = 1; i < l; i++ )

         {

           let x,

               m = map[i].l,

               str = [];

           while ( m > 0 )

             {

               x = Math.min( m, c );

               m = m - c;

               b = new Blob( [ f.slice( p, p + x ) ], { type: 'text/csv' } ); 

               result = await read_file( b );

               str.push( result.value );

               p = p + x;

             }; // loop while


            result = await write_qst( JSON.parse( str.join("") ) );

            $("#msg").text( result );

            str = null;

         }; // next i
*/

有趣的是，您已经在问题中说过应该做什么：

切片你的斑点。

Blob 接口确实有一个.slice() method.
但要使用它，您应该跟踪合并发生的位置。（可能位于数据库的其他字段中，甚至作为文件的标题：

function readChunks({blob, chunk_size}) {
  console.log('full Blob size', blob.size);
  const strings = [];  
  const reader = new FileReader();
  var cursor = 0;
  reader.onload = onsingleprocessed;
  
  readNext();
  
  function readNext() {
    // here is the magic
    const nextChunk = blob.slice(cursor, (cursor + chunk_size));
    cursor += chunk_size;
    reader.readAsText(nextChunk);
  }
  function onsingleprocessed() {
    strings.push(reader.result);
    if(cursor < blob.size) readNext();
    else {
      console.log('read %s chunks', strings.length);
      console.log('excerpt content of the first chunk',
        strings[0].substring(0, 30));
    }
  }
}



// we will do the demo in a Worker to not kill visitors page
function worker_script() {
  self.onmessage = e => {
    const blobs = [];
    const chunk_size = 1024*1024; // 1MB per chunk
    for(let i=0; i<500; i++) {
      let arr = new Uint8Array(chunk_size);
      arr.fill(97); // only 'a'
      blobs.push(new Blob([arr], {type:'text/plain'}));
    }
    const merged = new Blob(blobs, {type: 'text/plain'});
    self.postMessage({blob: merged, chunk_size: chunk_size});
  }
}
const worker_url = URL.createObjectURL(
  new Blob([`(${worker_script.toString()})()`],
    {type: 'application/javascript'}
  )
);
const worker = new Worker(worker_url);
worker.onmessage = e => readChunks(e.data);
worker.postMessage('do it');

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从客户端读取文本文件并在客户端上超出了javascript中单个字符串的最大大小的相关文章

Ajax文件上传

我想使用 Ajax 和 php 上传文件我有一个表格
libxmljs 的替代品 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案目标使用 Node js 访问网页使用 xpath 语法操作 DOM 并打印新的 DOM libxm
从 php 到 JavaScript 的数组

我正在尝试使用 json 将数组列表从 php 传输到 javascript 但它不起作用 JS ajax url getProfilePhotos php type post post or get method data if you
Crypto-Js 库的 hmac-256 脚本返回函数结构而不是 Google Apps 脚本中的值，在外部工作正常吗？

我正在设置一个谷歌电子表格项目来连接到我的 CryptoExchange API 但是当涉及到这个简单的 CryptoJs Hmac sha256 脚本时它不起作用它返回函数结构而不是值而在外部它工作正常看我的jsfiddle ht
如何将 Django 中的数组传递给模板并在 JavaScript 中使用它

我想将数组传递给模板然后通过 JavaScript 使用它 In my views py I have arry1 Str 500 20 return render to response test html array1 arry1 在
为什么隐式符号到字符串转换会导致 JavaScript 中出现类型错误？

有一个 toString on Symbol在 ES6 中它返回字符串表示形式Symbol 但想知道为什么 Symbol 不起作用运行这个表达式会抛出TypeError我没想到后者只是打电话吗 toString 在一个新的Symbol
如何在bootstrap中默认隐藏侧边栏？

我在这里有一个很好的参考作为 Bootstrap 在设计 Web 表单应用程序时的侧边栏 http startbootstrap com template overviews simple sidebar http startbootst
使用命名的成功/错误回调在 AngularJS 中声明一个 Promise

我正在尝试做一些与 http 服务非常相似的事情根据我的理解 http 返回一个 Promise 对象使用它时语法是 http success function data success callback error function
在动态创建的元素上添加事件监听器[重复]

这个问题在这里已经有答案了是否可以向所有动态生成的元素添加事件侦听器 Javascript 我不是页面的所有者因此我无法以静态方式添加侦听器对于页面加载时创建的所有元素我使用 doc body addEventListener cl
React 应用程序中的 addEventListener 不起作用

一些背景我正在尝试消费自定义网络组件在 React 应用程序中并尝试监听来自 Web 组件的事件我相信您不能只在自定义 Web 组件上以通常的反应方式处理事件 i e
如何使用 jQuery Ajax 将 PHP 数组值传递到另一个文件？

这是我的代码
游戏手柄 JavaScript 未能按预期更新

我正在尝试让浏览器报告我的 XBOX 控制器的状态然而在第一次按下按钮后它似乎变得卡住我究竟做错了什么
JavaScript：常量属性

在javascript中我可以将对象的属性声明为常量吗这是一个示例对象 var XU Cc Components classes or function aXU this Cc Components classes var XU new
避免在 ES6 的函数内定位 this 的对象作用域

例如我正在使用 D3 js 运行一个项目导入特定模块并调用它们的函数 Setup TypeScript ES6 导入特定的 D3 组件角6 我有一个对象在本例中是一个角度指令并在 SVG 画布上绘制一些圆圈并希望它们在拖动事件上
ReactCSSTransitionGroup 组件WillLeave 未调用

我尝试使用 ReactCssTransition 但不知何故该事件没有被调用 componentWillLeave 这是我的组件 import React Component from react import TransitionGrou
Firebase 身份验证在 iOS 登录时卡住，没有错误

我已经使用电子邮件和密码设置了 firebase 身份验证登录的最基本实现 firebase auth signInWithEmailAndPassword email password then gt console log Logged
尝试使用 Firebug 查找 JavaScript 文件中的函数

我试图找到这个函数调用 myFooBar 该函数在某些 HTML 中内联引用但页面加载了大量 JavaScript 并且在每个文件中搜索该函数需要相当多的工作如何使用 Firebug 找到此函数所在的 JavaScript 文件打开脚
为什么 Array.prototype.filter() 在 Magnolia JavaScript 模型中抛出错误？

我正在尝试过滤 FreeMarker 列表Magnolia JavaScript 模型 https documentation magnolia cms com display DOCS61 How to work with JavaScr
检测浏览器选项卡是否具有焦点

是否有可靠的跨浏览器方法来检测选项卡是否具有焦点场景是我们有一个定期轮询股票价格的应用程序如果页面没有焦点我们可以停止轮询并为每个人节省流量噪音特别是当人们喜欢打开具有不同投资组合的多个选项卡时 Is window onblur
在方法内部执行方法

我目前正在 FreeCodeCamp 中进行 JavaScript 练习我的代码应该使用的测试用例之一是函数调用如下所示 addTogether 2 3 这是我得到的基本功能 function addTogether return 当我

随机推荐

使用 Spark / java 的 ST_geomfromtext 函数

由于 ST GeomFromText 不是 org apache spark sql functions 的一部分因此它不会在内部识别它我需要首先为此函数定义 UDF 意味着我需要定义该函数的定义然后使用 Spark 将该函数注册为
复制一个对象并使两者共享一个成员变量 (C++)

我一直在思考和搜索这个问题但我无法解决这个问题我想要一个对象当复制到另一个对象时两个对象共享某些成员变量因此当我更改 object1 的成员变量的值时它也会更改 object2 中的变量例子 class ABC public
在 MySQL 中查找/搜索缺失值

我正在使用 MySQL 并且有一个名为sales 它的主键是sales id sales id invoice id 1 147 2 148 3 150 For sales id 3 the invoice id应该是 149 我想知道其中
' aria-label='如何在主机上构建和访问 libcu++' '> 如何在主机上构建和访问 libcu++'

libcu 2 1 0 包含适用于 c 14 及更高版本的 nvcc 的 mdspan 实现我尝试从 cppreference 实现 mdspan 示例代码 https en cppreference com w cpp containe
仅基于 R 中的一列计算条件均值

我有一个像这样的数据框 block plot date data 1 1 aug 11 95171507 1 1 aug 18 41451063 1 2 aug 9 506155236 1 2 aug 13 26259947 1 3 aug
AWS Lambda：如何提取S3存储桶中的tgz文件并将其放入另一个S3存储桶中

我有一个名为 Source 的 S3 存储桶许多 tgz 文件被实时推送到该存储桶中我编写了一个 Java 代码来提取 tgz 文件并将其推送到目标存储桶中我将代码作为 Lambda 函数推送我在 Java 代码中将 tgz 文
特定方向上经过 3 点的圆弧

我需要从特定方向的 3 个点绘制弧线假设我有 3 个 vec2 点 P1 P2 P3 我已经设法找到圆弧中心 circleCenter function b c d var temp Math pow c x 2 Math pow c y
你能在不使用图像的情况下在 IE 中实现 CSS 圆角吗？

有没有办法在 IE 中制作圆角边框而不使用仅使用 CSS 的图像或者任何其他简单的方法我在 Stack Overflow 上查过类似的其他问题但没有找到确切的方法保留为书签 http www smashingmagazine com
C++：嵌套映射

这是定义 struct nmap struct nmap map
AJAX 将检索到的值显示为未定义

我正在使用 AJAX 将值发送到 PHP 并从 PHP 检索值问题是我从 PHP 获得的值在 AJAX 中被视为未定义请帮我解决这个问题 AJAX代码 var channel function overall one show two
r mongolite - 日期查询

Question 使用mongolite封装在R 如何查询数据库中的给定日期示例数据考虑一个test包含两个条目的集合 library mongolite create dummy data df lt data frame id c
使用 clang++ 在 Eclipse 中的 Autotools 项目中进行代码分析

我在 Mac OS 10 8 上使用 Eclipse 4 2 并安装了命令行工具 Xcode 4 6 3 clang 编译器通过使用以下标志来支持 C 11 std c 11 stdlib libc 我在 Eclipse 中有一个 Auto
如何在 MS SQL 2005 中使用 SQL XQuery 修改多个节点

在表中我有以下内容 ParameterID int ParameterValue XML 1
使用 PHP 在下拉选择中显示所选值

我正在尝试根据数据库信息加载下拉选项值我有以下代码并且工作正常但我不知道如何在下面编写代码以显示所选值 output null foreach records gt result as row output
构建失败并显示“命令因非零退出代码而失败”

当我尝试使用 Xcode 构建应用程序时错误中断了构建过程 Command CompileStoryboard因非零退出代码而失败有时它会显示此错误 Command CompileSwift因非零退出代码而失败 I have 新建系统
Visual C++ 6.0支持unicode吗？

我必须将 C 6 0 项目迁移到 Visual C 2010 项目首先我必须将 prj 转换为 unicode 然后转换为 vs 2010 我很困惑 Visual C 6 0 是否支持 unicode 如何知道它谢谢是的它与最新版
XML 中定义的 TextView 中的不同颜色

我想在单个 TextView 中定义不同的颜色如下所示 font color yellow Hi font font color red everybody font 我看到了这个链接 TextView 中可以有多种样式吗但这不适合我
检查WebView是否正在播放视频

是否可以检查 WebView 目前是否正在播放视频如果是则获取要下载的该视频的 http mp4 URL 我已经尝试过这段代码 public void onLoadResource WebView view final String u
如何将 Windows GUI 应用程序作为服务运行？

我有一个现有的 GUI 应用程序应该将其实现为服务基本上我需要能够远程登录和注销 Windows 2003 服务器并且仍然保持该程序运行这可能吗编辑这里进一步细化我没有来源这不是我的应用程序 Windows 服务不能有 G
从客户端读取文本文件并在客户端上超出了javascript中单个字符串的最大大小

我想反转在 javascript 中在客户端上执行的以下步骤但在处理 blob 时遇到了问题在 indexedDB 数据库中在对象存储索引上打开的游标上从数据库中提取数据对象使用 JSON stringify 将对象转换为字符串

从客户端读取文本文件并在客户端上超出了javascript中单个字符串的最大大小

从客户端读取文本文件并在客户端上超出了javascript中单个字符串的最大大小 的相关文章

随机推荐

热门标签

从客户端读取文本文件并在客户端上超出了javascript中单个字符串的最大大小的相关文章