使用 Google App Script 从 google 驱动器中进行 OCR 图像

2024-02-27

我已经实现了以下脚本，使用图像 URL 对单个和多个图像进行 OCR。

function doOCRALL() {
  var selected = SpreadsheetApp.getActiveSheet().getActiveRange().getValues().length;
  for (var i = 0; i < selected; i++) {
    var activeCol = SpreadsheetApp.getActiveSheet().getActiveCell().getColumn();
    var activeRow = SpreadsheetApp.getActiveSheet().getActiveCell().getRow();
    var valueURL = SpreadsheetApp.getActiveSheet().getRange(activeRow + i, activeCol).getValue();

    var image = UrlFetchApp.fetch(valueURL).getBlob();

    var file = {
      title: 'OCR File',
      mimeType: 'image/png'
    };

    // OCR is supported for PDF and image formats
    file = Drive.Files.insert(file, image, {ocr: true});
    var doc = DocumentApp.openByUrl(file.embedLink);
    var body = doc.getBody().getText();
    //Get link Doc that Generated
    SpreadsheetApp.getActiveSheet().getRange(activeRow + i, activeCol + 2).setValue(file.embedLink);
    //Get Content of Doc that Generated
    SpreadsheetApp.getActiveSheet().getRange(activeRow + i, activeCol + 1).setValue(body);

  }
}


function doOCR() {
  //
  var activeCol = SpreadsheetApp.getActiveSheet().getActiveCell().getColumn();
  var activeRow = SpreadsheetApp.getActiveSheet().getActiveCell().getRow();

  var valueURL = SpreadsheetApp.getActiveSheet().getRange(activeRow, activeCol).getValue();

  var image = UrlFetchApp.fetch(valueURL).getBlob();

  var file = {
    title: 'OCR File',
    mimeType: 'image/png'
  };

  // OCR is supported for PDF and image formats
  file = Drive.Files.insert(file, image, {ocr: true});
  var doc = DocumentApp.openByUrl(file.embedLink);
  var body = doc.getBody().getText();


  // Print the Google Document URL in the console
  Logger.log("body: %s", body);
  Logger.log("File URL: %s", file.embedLink);
  //Get link Doc that Generated
  SpreadsheetApp.getActiveSheet().getRange(activeRow, activeCol + 2).setValue(file.embedLink);
  //Get Content of Doc that Generated
  SpreadsheetApp.getActiveSheet().getRange(activeRow, activeCol + 1).setValue(body);
}



function onOpen() {
  var ui = SpreadsheetApp.getUi();
  // Or DocumentApp or FormApp.
  ui.createMenu('OCR Tools')
      .addItem('Extract Cell', 'doOCR')
      .addItem('Extract All Cell', 'doOCRALL')
      .addSeparator()
      .addSubMenu(ui.createMenu('About US')
          .addItem('Infomation', 'menuItem2'))
      .addToUi();
}

function menuItem2() {
  SpreadsheetApp.getUi() // Or DocumentApp or FormApp.
     .alert('AIO Team');
}

当我为任何图像提供图像 URL 时，它就会起作用。但是，如果我在驱动器上上传相同的图像，然后提供驱动器中的图像 URL，它只会给我“登录主菜单”。对于其他驱动器图像，它给出相同的文本。提前致谢。

如果内容已在云端硬盘中，则无需获取其链接 - 只需提供文件 ID（可以从其链接中获取）。

获得文件 ID 后，您可以简单地复制它，并使用最佳参数来激活 OCR。当然，完整的选项列表可以在 Drive REST API 页面上找到：https://developers.google.com/drive/api/v2/reference/files/copy#parameters https://developers.google.com/drive/api/v2/reference/files/copy#parameters我鼓励您还阅读有关最佳实践的内容，例如fields规范（这是更新的驱动 API 版本的要求）。

此函数采用您从某处获取的输入云端硬盘文件 ID 和真值来设置“使用 OCR”选项。明显的假设是您有权限、ID 有效、您已在云控制台中启用高级服务和 Drive API 等。

function getIdOfCopyOfDriveFile(fileId, useOcr) {
  const options = {
    fields: "choose the metadata fields to return in the response e.g. 'id,title,parents'"
  };
  const existingMetaData = Drive.Files.get(fileId, options);

  options.ocr = !!useOcr;
  existingMetaData.title += " (copied with" + (options.ocr ? " " : "out ") + "ocr)";
  // We could do other modifications of fields we requested before
  // copying, like changing the parents array to move the new file.
  const newFileMetaData = Drive.Files.copy(existingMetaData, fileId, options);
  return newFileMetaData.id;
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

googleappsscript

googlesheets

OCR

googledocs

使用 Google App Script 从 google 驱动器中进行 OCR 图像的相关文章

图像未显示在从 HTML 创建的 PDF 上

我想动态创建 PDF 这意味着我将从 Google Drive 获取文件然后将它们放入 HTML 代码中并尝试从中创建 PDF 一切工作正常除了图像没有显示我现在正在做的是从 HTML 字符串创建 HtmlOutput 获取该 H
复制电子表格也会复制所有链接的文件

当我使用库方法时我希望能够仅复制电子表格及其所有工作表以及所有定义的工作表名称 spreadSheet copy newSSName Or myFile makeCopy newNameOfFile 目前这些方法复制所有链接的表单和表单
Tess4j 问题 java.lang.UnsatisfiedLinkError

我正在尝试解决 Tess4J 安装问题 1 我在 WEB INF win32 x86 中创建了一个文件夹2 我把 libtesseract302 dll 和 liblept168 dll 放在那里然后将其添加到 java 构建路径中的源
如何使用 OnChange() 触发器

我有一个电子表格以及该电子表格的主副本每次用户将数据输入单元格时它都会获取新数据并放入主副本中然而最近我注意到一个用户创建了一个新列该列未被 OnEdit 捕获于是我查了一下看到了去年实现的OnChange 但是我不知道如何
一起使用“过滤”和“排序”的 Google 表格

这是我的第一个问题我希望一切都好我是使用谷歌表格的新手但我正在慢慢进步我正在尝试构建一个工作表其中包含工作表 1 中的所有数据在工作表 2 上我想过滤工作表 2 中 D 列中标有数字 1 的所有数据为此我正在使用 FILT
BigQuery REGEXP_MATCH 和重音：边界通配符失败？

在 GAS 中我可以正确地将重音符号与具有边界字符的正则表达式相匹配例如 b b 仅当字符是单独的单词时才匹配这在 GAS 中有效 function test regExp var str la s ance est Paris v
Google Sheets API v4 和 valueInputOption

我的电子表格中有三列第一个是日期第二个和第三个是简单字符串当我批量上传数据时valueInputOption RAW 我的日期列得到错误的结果所有日期前面都有一个看不见的撇号字符串列没问题当我使用valueInputOption
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i
将姓名拆分为名字和姓氏 Java（Android OCR）[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我使用本机 Android JAVA 创建了一个 OCR 光学字符识别应用程序我可以将图像转换为文本视图但是我如何使用这些词分别识别名
使用 Promise 对 Google 表格进行多次查询

我是一名初学者编码器需要一些帮助来加快我的 Google 表格查询速度我环顾四周找不到解决方案我正在尝试快速对 Google 表格运行 25 个查询这就是我的尝试方式对 Google 工作表运行查询将结果推送到数组运行不同的
从 Google 电子表格接收实时更新

我正在尝试设置与 Google 电子表格的双向同步我可以使用其数据集将更改推送到 Google 电子表格Google 表格 API V4 https developers google com sheets 现在我希望每当有人实时或近实
在Google电子表格中划分整列

我是 Google 电子表格的一个相对较新的用户我希望 B 列中的每个单元格都是 A 列同一行中内容除以 5 的结果 B1 B2 B3 等商应为 A1 A2 A3 等被除数除以 5 除数在示例中 B1 A1 5 我知道一项一
查询新的谷歌电子表格

我使用谷歌可视化创建了一个折线图该代码查询谷歌电子表格当我使用普通电子表格第 1 行时它可以工作当我使用新的谷歌电子表格第 2 行的 URL 时出现以下错误 Error in query request time out 我
在 Google 表格中创建每周/每月/每年折线图，以汇总同一周/月/年范围内的金额

我想创建一个代表两列数据的折线图 F 输入日期和 H 美元金额 X 轴应为日期 Y 轴应为美元金额问题是我希望折线图上的日期代表给定周月或年输入的所有金额的总和这张照片是 YouTube 分析的它创建了一个与我想在工作表中创建的类
在 Google 表格脚本中设置活动单元格的值

我想创建一个公式在某个单元格更改上创建时间戳下面的代码就可以了我现在想做的是将公式转换为纯文本将该时间戳锚定到工作表上如果您手动执行此操作您将选择时间戳复制它们并将它们粘贴为值我不想手动执行此操作因此我创建了下面的脚本它
将身份验证从一个 Google Apps 脚本网络应用程序传递到另一 Google Apps 脚本网络应用程序

我的 Google Apps 帐户中有两个 Google Apps 脚本两者均已发布为具有以下设置的网络应用程序脚本A 像我一样执行谁有权访问网络应用程序 XXXXXXX com 内的任何人脚本B 以访问应用程序的用户身份执行谁有权访
ArrayFormula 破坏了 getLastRow() 函数。可能的解决方法？

在我的电子表格中我有一个正在运行的脚本它使用getLastRow 功能是其逻辑的重要组成部分自从我在其中一列中应用数组公式以来 getLastRow 功能无法正常工作即使其他列中没有其他值数组公式似乎也一直应用到工作表的底部
Google 表格 - ARRAYFORMULA 中的 VLOOKUP

我正在尝试在 Google 表格中的数组公式内进行 Vlookup 我有两张纸 S1 和 S2 每个列都有 3 个相同的列 A 列日期 B 列名称和 C 列付款类型我想根据日期和姓名组合匹配将付款类型从表 2 读取到表 1 这意味
使用 Google Advanced Drive 服务通过 Apps 脚本在文件夹中创建新文件

创建新文件有四种方法 DocsList 显示为DocsList在主列表中内置于 Apps 脚本中 DriveApp 显示为Drive在主列表中内置于 Apps 脚本中驱动器 API 也显示为Drive在主列表中必须添加到 Apps
从电子表格脚本中调用 Web 应用程序脚本？

如何从 Google 电子表格容器中的脚本调用外部 Google Web App 脚本我有许多动态创建的电子表格并希望它们全部调用一个 Web 应用程序以实现一致性和易于维护看看这篇博文触发主从电子表格之间的更新 http www

随机推荐

带 dom-repeat 的 Polymer 1.0 动态模板

我有一个场景我想创建动态template将与 Polymer 一起使用的元素dom repeat 我当前的原型如下 JSbin演示 http jsbin com hitotahoqe edit js output var domRepea
org.openqa.selenium.NoSuchElementException：尝试通过 CssSelector 定位 card-fields-iframe 时，返回的节点 (null) 不是 DOM 元素

我正在尝试通过部分 id 来定位 iframe 对于这个方法我使用了 driver switchTo frame driver findElement By cssSelector iframe id card fields number
Java计算MD5哈希值

In http www anyexample com programming java java simple class to compute md5 hash xml http www anyexample com programmin
FireFox 中内容可编辑的光标位置/样式

我在 FireFox 3 中使用 contentEditable 时遇到问题我遇到的问题是在单击 div 后光标将出现在 div 上方或仅部分出现在 div 中直到我开始输入此时它的行为正确关于如何阻止这种情况发生有什么想法吗
为什么在 exec() 之前调用 quit() 不会退出应用程序？

为什么这个程序可以正常运行并显示主窗口我希望它会退出quit 在构造函数中调用主要 cpp include
Qt 5.0程序在QtCreator中运行但不在外部运行

这是上下文我在Windows 7 x64下用Qt开发了一个程序我已经升级到Qt 5 0 1 QtCreator 2 6 1 编译器VS2010 现在状态我的程序在 QtCreator 中运行良好但是当我在外面尝试时我收到了几个错误
在 Swift 中向 NSLayoutAnchor 约束添加乘数

锚约束简化了添加约束的过程但故事板中可用的乘数属性似乎并不适用于所有类型的约束例如作为根据这里的答案 https stackoverflow com questions 63042059 center uilabel created
使用 awk 删除包含唯一第一个字段的行？

希望仅打印具有重复第一个字段的行例如从看起来像这样的数据 1 abcd 1 efgh 2 ijkl 3 mnop 4 qrst 4 uvwx 应该打印出 1 abcd 1 efgh 4 qrst 4 uvwx 仅供参考我的数据中第一个字
hadoop/bin/hadoop 没有示例 jar

我安装了 hadoop 2 2 0 并尝试运行示例 wordcount 程序为此我首先使用以下命令将数据导入到 hdfs bin hadoop fs copyFromLocal home prassanna Desktop input
FileBeat 收获问题

我们使用 ELK 来控制我们的程序日志在我们的 FileBeat 配置中我们从中获取30种不同包含每秒更新的文件的路径它仅在产品机器中每秒更新在其他开发机器中我们的日志要少得多我们的日志文件不会被删除直到它们变旧并且我们停止使
Indy 和 smtps：无法连接

我正在尝试使用 Indy 和说明的技术从 smtps 安全 smtp 发送电子邮件在 Marco Cant 的这篇文章中 http www marcocantu com tips oct06 gmail html 这就是我正在使用的 obj
在 SciKit 线性回归上出现“ValueError：形状未对齐”

一般来说 SciKit 和 Python 的线性代数机器学习相当新所以我似乎无法解决以下问题我有一个训练集和一个测试数据集其中包含连续值和离散分类值 CSV 文件被加载到 Pandas DataFrame 中并匹配形状分别为 1
初始化列表与向量

在 C 11 中可以使用初始化列表来初始化函数中的参数其目的是什么不能用 const 向量做同样的事情吗下面两个程序有什么区别使用初始化列表 include
Apache Beam 计数器/指标在 Flink WebUI 中不可用

我正在使用 Flink 1 4 1 和 Beam 2 3 0 并且想知道是否可以在 Flink WebUI 或任何地方中提供可用的指标如 Dataflow WebUI 中那样我用过类似的计数器 import org apache be
数据库操作的任务与服务

JavaFX 8 任务和服务之间有什么区别在哪种情况下使用其中一个更好数据库操作用什么比较好任务和服务之间的主要区别一次性执行与重复执行 A Task http docs oracle com javafx 2 api javafx
C 中的布谷鸟哈希

有没有人有实施布谷鸟哈希 http en wikipedia org wiki Cuckoo hashing在C语言中如果有一个开源的非 GPL 版本那就完美了既然 Adam 在评论中提到了它有人知道为什么它没有被太多使用吗这只是一
Python 3.10 匹配/大小写与常量[重复]

这个问题在这里已经有答案了我尝试用更短的代码块替换 if elif elif else 代码块match case从 Python 3 10 开始我定义了三个常量并希望对每个常量执行不同的操作因此我的代码大致如下所示 gt gt g
BadTokenException：无法添加窗口——令牌 null 无效；您的活动正在运行吗？在activity.isFinishing语句中

如果用户仍在当前活动中我有一个需要在几秒钟后显示的弹出窗口我实现了一个语句检查活动是否未完成销毁然后显示弹出窗口对于周末用户来说它工作得很好从一个活动缓慢单击到另一个活动但在高压测试中活动正在重新创建完成快速移动形式
Android studio 导航抽屉在设计视图上显示黑屏

我安装了 Android studio 3 1 3 但它只显示黑屏构建 gradle apply plugin com android application android compileSdkVersion 28 defaultCon
使用 Google App Script 从 google 驱动器中进行 OCR 图像

我已经实现了以下脚本使用图像 URL 对单个和多个图像进行 OCR function doOCRALL var selected SpreadsheetApp getActiveSheet getActiveRange getValues

使用 Google App Script 从 google 驱动器中进行 OCR 图像

使用 Google App Script 从 google 驱动器中进行 OCR 图像 的相关文章

随机推荐

热门标签

使用 Google App Script 从 google 驱动器中进行 OCR 图像的相关文章