Azure 认知搜索文本翻译技能 50k 字符限制

2023-12-30

我们正在使用 Azure 认知搜索来索引各种文档，例如Word 或 PDF 文件，存储在 Azure Blob 存储中。我们希望能够翻译提取的非英语文档内容，并将翻译结果存储到索引中的专用字段中。

目前，内置的文本翻译认知技能最多支持输入 50,000 个字符。我们拥有的文档最多可以包含 1 MB 的文本。根据文档，可以使用内置的分割技能将文本分割成块，但是没有任何技能可以将翻译后的块重新合并在一起。我们的目标是将所有提取的文本翻译并存储在 Edm.String 类型的一个索引字段中，而不是数组中。

除了为此目的通过 Web API 创建自定义认知技能之外，有什么方法可以在索引时翻译大文本块？

是的合并技能 https://learn.microsoft.com/en-us/azure/search/cognitive-search-skill-textmerger实际上会这样做。如下定义您的技能集中的技能。此技能的“文本”和“偏移量”输入是可选的，您可以使用“itemsToInsert”指定要合并在一起的文本（指定翻译输出的适当来源）。如果您想在每个合并部分之前或之后插入一个空格，请使用 insertPreTag 和 insertPostTag。

{
  "@odata.type": "#Microsoft.Skills.Text.MergeSkill",
  "description": "Merge text back together",
  "context": "/document",
  "insertPreTag": "",
  "insertPostTag": "",
  "inputs": [
    {
      "name": "itemsToInsert", 
      "source": "/document/translation_output/*/text"
    }
  ],
  "outputs": [
    {
      "name": "mergedText", 
      "targetName" : "merged_text_field_in_your_index"
    }
  ]
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

azurecognitivesearch

azuretexttranslation

Azure 认知搜索文本翻译技能 50k 字符限制的相关文章

Azure 搜索 - 作为第一个或单个结果完全匹配

我使用基于丰富的 Lucene 查询解析器语法的 Azure 搜索我将 1 定义为距离符号的附加参数但我面临的问题是即使存在完全匹配实体也没有排序例如 blue 1 将返回 blues blue glue 或者当搜索 P002 等
Azure 搜索突出显示带双引号的短语

我们有一个天蓝色的Web应用程序其中有一个搜索框当我们输入带双引号的文本例如应用程序服务时它会正确列出带有应用程序服务的记录但它不仅突出显示应用程序服务而且还突出显示应用程序服务以及服务如果单独找到它们可以
在 Azure 搜索中使用 StartsWith 进行搜索

我有一个场景我必须使用 Azure 搜索使用供应商名称来搜索供应商例如下面是供应商列表印孚瑟斯科技有限公司印孚瑟斯 BPM 有限公司信息解决方案印孚瑟斯公司技术戴尔电脑第一信息系统公司我的搜索场景是当搜索文本为Info
Azure 搜索是否处理同义词

Azure 搜索可以根据同义词进行搜索吗例如如果我搜索鞋类系统应该获取以下结果鞋类的同义词如鞋子凉鞋等我进行了很多搜索但未能找到有关它的适当文档我能找到的最接近的是一个帖子说它还不支持但这是一个旧帖子 https s
如何在 Azure 搜索中忽略重音符号？

Azure 搜索是否支持某种忽略重音字符的方式例如如果有人搜索e它应该包括搜索中的字符或者我们是否需要在构建 Azure 搜索索引时添加一些转换欢迎任何建议谢谢是的请在您的现场使用 ASCII 折叠分析仪为此请将字段上的
如何在Azure中搜索包含引号的文本（转义单引号）？

我有一个关于 azure 搜索的查询如下所示 results indexClient Documents Search
在 Azure 搜索上上传文档后，我可以立即删除它吗？

1 假设我使用Azure搜索API上传一个新文档 POST indexes index name docs index api version api version 2 我收到 HTTP 代码 201 的响应文档已成功创建 3 我再次使
如何使用 Azure Search Like 语法

在我的Azure搜索中我有两个文档其中一列称为描述还有两个这样的记录 Description XARATM KONE Description ATM RCOR 我的问题是当我使用 Azure 搜索搜索我的记录时喜欢 https
Azure 认知搜索文本翻译技能 50k 字符限制

我们正在使用 Azure 认知搜索来索引各种文档例如Word 或 PDF 文件存储在 Azure Blob 存储中我们希望能够翻译提取的非英语文档内容并将翻译结果存储到索引中的专用字段中目前内置的文本翻译认知技能最多支持输入 5
在 azure 搜索中索引字典属性

我有一个具有 type 属性的 DTODictionary
当结果具有相同分数时在 Azure 搜索中进行分页

我在电子商务网站上使用 Azure 搜索现在在搜索页面上遇到分页问题当我重新加载搜索页面时我可以获得不同的产品顺序因此当我使用分页时我可以在不同页面上看到相同的产品这一点至关重要我开始研究出了什么问题我在 Microsof
如何在 Azure 搜索 REST API 上使用“id”删除特定文档？

我想知道如何删除Azure搜索索引中的特定文档我想通过 REST API 使用 id 来删除文档我曾寻找过但找不到路 odata context https xxxx metadata docs value search score
Azure 搜索 - 推广旧数据

我正在创建 Azure 搜索评分配置文件在我的数据集中我有一个Edm DateTimeOffset字段称为ExpiresOn 我正在使用这个字段来推广某些文档为此我使用了这样的新鲜度函数 name Aging functions t
为什么分页时可能会从 Azure 搜索中获得重复的结果？

有时在使用时Azure 搜索的分页 https learn microsoft com en us azure search search pagination page layout结果中可能存在重复的文档下面是一个分页请求的示例 GE
获取 Azure 搜索中的实际匹配数

Azure 搜索一次最多返回 1 000 个结果对于客户端上的分页我想要总数匹配项以便能够在底部显示正确数量的分页按钮并能够告诉用户有多少结果但是如果超过一千个我如何获得实际数量我只知道有at least1 000 场比赛
使用 lucene 模糊搜索和 Azure 搜索的同义词

我希望能够同时处理模糊搜索和同义词我尝试了多种方法但无法使其正常工作我的索引中有这些值 white black light dark 这个同义词规则 white light black dark 如果我执行查询queryType fu
Azure 搜索是否提供 Etag 来管理添加、更新或删除文档的并发性？

如何管理 Azure 搜索中的并发 https learn microsoft com en us azure search search howto concurrency 这里据说Azure Search提供了乐观并发模型资源上没有锁
Azure 搜索和破折号

我正在使用 Azure 搜索并尝试对文档执行搜索看起来好像是这样做的 indexes blah docs api version 2015 02 28 search abc 1003 返回与此相同的结果 indexes blah docs
AzureSearch-从数据源检测索引架构时出错

我通过 REST API 在 Azure 搜索上创建了一个数据源我使用 API 而不是门户因为我有一个尚未在门户上处理的 rowversion 数据类型我可以在门户上查看数据源当我尝试将数据源导入索引时出现以下错误从数据源检测索
DotNet Core Azure 搜索 SDK - 过滤结果

我们正在尝试将筛选器功能实现到 Azure 认知搜索中我希望找到一些不错的 SDK 方法来隐藏所有丑陋的部分但到目前为止我发现的唯一示例如下 source https learn microsoft com en us azure s

随机推荐

python 'speedtest' 没有属性 'Speedtest'

我试图通过使用 speedtest 模块来获取 python 中的下载和上传速度但是当我使用该模块时它给了我这个错误属性错误模块 speedtest 没有属性 Speedtest 我只是声明了变量这是我的代码 import spee
在 Solr 中使用“terms”与“select?qt=terms”

我在使用 Solr 4 2 0 的 terms 请求处理程序时遇到困难使用 Web 浏览器以下 url 返回 fieldName INDUSTRY 的术语列表 http localhost 8983 solr collection1 t
iOS：更新 App Store Connect 中的营销 URL，无需上传新版本

是否可以更新营销网址无需在应用商店上传新版本不幸的是这是不可能的如果没有新版本您唯一可以更改的是促销文本
Safari Web Extension - 仅在单击扩展按钮时注入脚本

为了简单起见我参考了 Apple 的 SeaCreator 扩展示例您可以从这里获取 https drive google com file d 1loBDgkJAEtyh0QehOUlgOSyUnW9ZZDk6 view usp sh
Pandas 中 SQL 中的 EXCEPT 子句类似于什么？

我有一个示例 pandas 数据框 df col1 col2 col3 col4 0 a 1 0 2 0 3 1 b NaN NaN 6 2 c NaN 8 0 9 3 d NaN 11 0 12 4 e 13 0 14 0 15 5 f
用信号中断 c/c++ readline

我试图用信号 SIGUSR1 中断readline 但显然如果信号未被处理程序就会退出处理时它的readline会继续进行就好像什么也没发生一样 readline 应该能够使用信号中断吗我从另一个问题中得到了这个想法强制退出 r
如何知道窗口“load”事件是否已被触发

我正在写一个 JavaScript 脚本该脚本可能会异步加载 AMD 格式在这个脚本中我不想做任何重要的事情直到window load事件被解雇所以我监听窗口加载事件但是如果脚本是在 window load 事件之后加载的
Java ArrayList：复制构造函数和通过赋值复制之间的区别

我有两个清单 ListA and ListB我想复制ListB to ListA 就复杂性和结果而言以下内容有什么区别 ListA ListB ListA new ArrayList ListB With listA listB 只有一个
如何检查DataTable上的IS NULL？

就我而言我正在传递一个 sql 查询并获取数据集中的数据但是当我尝试获取 ParentId 列包含 NULL 的行时会出现问题这是一段代码 DataSet ds GetDataSet Select ProductId ProductN
当我尝试在构建器中显示 SnackBar 时出错

这是我的main dart class MyApp extends StatelessWidget var login new Login xxxxxxx xxxxxxxxx final scaffoldKey new GlobalKey
如何删除 python tkinter treeview 中的所有行？

每当我选择新目录时我想删除所有行但当我选择新目录时它会附加每当我选择新目录时我希望删除所有以前的行并插入新行 def dirNmeFrmBtn do if do path tkFileDialog askdirectory else
vim CTRL-] 键未按预期工作

In help tag it says that one can go to a tag definition using the CTRL keystroke But I can t get this to work I thought
尝试获取用户数据时 LDAP 上的搜索过滤器错误

我刚刚使用 LDAP 因此请告诉我我是否以完全错误的方式执行此操作我正在使用 bhLDAPAuthPlugin 插件使用 Symfony 1 4 我正在使用 LDAP 验证用户登录但是 LDAP 表中有更多数据我想使用用户名查询所以
如何将自定义 CSS 图像添加到 Squarespace 中给定文本层后面的目标背景？

我们正在努力为 Squarespace 的客户定制一个网站以便他们可以自己管理我在一层文本的背景中添加了 CSS 样式但它不会显示我已将要使用的图像导入 Squarespace 并且有 URL 我还检查了页面元素并找到了我想要定位的
在android中将对象从一个应用程序传递到另一个应用程序

经过大量谷歌搜索后我找不到任何方法将对象从一个应用程序传递到另一个应用程序虽然我知道我们可以使用 Parcel 将对象从一个活动传递到另一个活动但如何在应用程序之间执行此操作我的对象是这个 public class MyObject
Django 特定设置应用程序

我正在开发一个 Django 应用程序它需要一个目录来下载和存储文件我希望保持我的应用程序可重用因此我不想对该目录的路径进行硬编码所以我想让这个路径成为一个设置一个可以设置的全局变量我可以把这个设置全局变量放在哪里这种做法好
localStorage不存储多于一份数据

我正在尝试在 localStorage 中存储多条数据然而只存储了一件我不明白为什么这是代码 div div div div
C++试图理解顺时针规则来破译复杂的语法

我有以下代码 int ia 3 4 0 1 2 3 4 5 6 7 8 9 10 11 int p4 4 ia cout lt lt p4 0 3 lt lt p4 0 3 lt lt endl cout lt lt p4 0 3 lt l
Cypress.io + TypeScript。测试开始时断言调用

我是 Cypress io 和 TypeScript 的新手所以我不明白这里的一些东西 My code Test describe TEST description function it newJobCreation function
Azure 认知搜索文本翻译技能 50k 字符限制

我们正在使用 Azure 认知搜索来索引各种文档例如Word 或 PDF 文件存储在 Azure Blob 存储中我们希望能够翻译提取的非英语文档内容并将翻译结果存储到索引中的专用字段中目前内置的文本翻译认知技能最多支持输入 5

Azure 认知搜索文本翻译技能 50k 字符限制

Azure 认知搜索文本翻译技能 50k 字符限制 的相关文章

随机推荐

热门标签

Azure 认知搜索文本翻译技能 50k 字符限制的相关文章