将 Twitter 数据索引到 ElasticSearch 中:已超出索引中总字段 [1000] 的限制

2023-11-26

我有一个系统可以将 Twitter Stream 索引到 Elasticsearch 中。它已经运行了几个星期了。

最近出现了一个错误,内容如下:Limit of total fields [1000] in index [dev_tweets] has been exceeded.

我想知道,有人遇到过同样的问题吗?

另外,如果我运行这个curl:

$ curl -s -XGET http://localhost:9200/dev_tweets/_mapping?pretty | grep type | wc -l
     890

它应该给我或多或少的映射中的字段数量。字段很多,但不超过1000个


此限制已在以下 GitHub 中介绍issue.

命令计数grep type | wc -l计算文本的行数"type"。因此我认为计数有可能不准确。我做了一个小文本,得到的值比实际字段数更高。所以你得到的字段数量也可能少于实际数量,但我还想不出一个场景。

这是我做的测试。

curl -s -XGET http://localhost:9200/stackoverflow/_mapping?pretty

{
  "stackoverflow" : {
    "mappings" : {
      "os" : {
        "properties" : {
          "NAME" : {
            "type" : "text",
            "fields" : {
              "keyword" : {
                "type" : "keyword",
                "ignore_above" : 256
              }
            }
          },
          "TITLE" : {
            "type" : "text",
            "fields" : {
              "keyword" : {
                "type" : "keyword",
                "ignore_above" : 256
              }
            },
            "fielddata" : true
          },
          "title" : {
            "type" : "text",
            "fielddata" : true
          }
        }
      }
    }
  }
}

自从"type"是否有 5 行,即使我只有 3 个字段,我得到的输出却是 5。

Can you 尝试增加限制看看它是否有效?

PUT my_index/_settings
{
  "index.mapping.total_fields.limit": 2000
}

您还可以在创建索引期间增加此限制。

PUT my_index
{
  "settings": {
    "index.mapping.total_fields.limit": 2000,
    "number_of_shards": 1,
    "number_of_replicas": 0
  },
  "mappings": {
    ...
  }
}

学分:https://discuss.elastic.co/t/total-fields-limit-setting/53004/2

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将 Twitter 数据索引到 ElasticSearch 中:已超出索引中总字段 [1000] 的限制 的相关文章

  • 全文搜索 DynamoDB

    以下情况 我正在为我的客户将元素存储在 DyanmoDb 中 HashKey 是元素 ID Range Key 是客户 ID 除了这些字段之外 我还存储一个字符串数组 gt 标签 例如 Pets House 和多行文本 我想在我的应用程序中
  • PHP - Twitter API (OAuth) 分页无法正常工作

    我已经集成了 Twitter API Twitter OAuth 来获取特定公司帐户的最新提要 下面是我到目前为止所做的代码 https tomelliott com php authenticating twitter feed time
  • Twitter REST API:可以热链接 Twitter 图像吗?为什么 Firefox 中不显示图像?

    我正在尝试从 Twitter REST API 中提取图像并显示这些图像 因此 我陷入了逻辑僵局 因为我的 PHP HTML 代码未在本地主机 PHP 内置开发服务器的浏览器中显示图像 我更喜欢 Firefox 因为它是更安全 私密 的浏览
  • Twitter 不再使用请求库 python

    我有一个 python 函数 它使用 requests 库和 BeautifulSoup 来抓取特定用户的推文 import requests from bs4 import BeautifulSoup contents requests
  • 我们可以同时使用拼音标记和同义词吗?

    我正在尝试同时启用语音分析器和同义词 这似乎不起作用 它们一起使用有错吗 在下面的实现中 我希望使用同义词转换搜索查询 然后使用语音分析器来检索结果 但我的同义词在这里完全被忽略了 如果我在创建索引时删除语音分析器 那么同义词就可以正常工作
  • Tweepy:tweepy.errors.Unauthorized:401 需要授权

    我期待使用以下 Tweepy 代码从我的 Twitter 个人资料中提取一些数据 import tweepy client tweepy Client consumer key consumer key consumer secret co
  • 我可以查看当前登录的 Twitter 用户吗?

    他们没有通过我的网站进行 OAuth 验证 但在该浏览器上登录到 Twitter 有什么办法让我知道他们的 Twitter 用户名吗 饼干 什么 除非某些东西非常糟糕或者 Twitter 明确提供了用于此目的的 API 否则不会 至少不是通
  • 无法使用 java 8 在 Windows 10 上安装 elasticsearch 5.1.1

    我正在尝试在安装了 java 8 111 的 Windows 10 笔记本电脑上安装 ElasticSearch 5 1 1 当我尝试安装 Elastic search 时触发错误 C Users 用户名 Downloads elastic
  • search_after 在弹性搜索中如何工作?

    我一直在尝试在我们的应用程序中使用 Elasticsearch 但分页限制为 10k 对我们来说实际上是一个问题 并且由于必须超时问题 滚动 API 也不是推荐的选择 我发现 Elasticsearch 有一个叫做 search after
  • 如何使用 XCode 在 iOS 应用程序中的推文中上传视频

    我是 iOS 开发新手 需要对我正在接管的 iOS 应用程序进行更改 以将视频添加到推文中 我当前的应用程序 UI 允许用户输入推文文本 但我将对其进行更改 以允许他们选择要与推文一起上传的视频 类似于 Twitter 应用程序的工作方式
  • Twython - 如何使用媒体 url 更新状态

    在我的应用程序中 我允许用户在 Twitter 上发帖 现在我想让他们通过媒体更新他们的状态 In twython py我看到一个方法update status with media从文件系统读取图像并上传到 Twitter 我的图像不在文
  • 指向 Twitter 用户的 URL 链接(包含 ID,而不是姓名)

    我想要一个指向我的 Twitter 页面的链接 该页面使用我的 Twitter ID 而不是 Twitter 名称来引用它 这是因为我想将链接构建到应用程序中 并且该帐户的 Twitter 名称将来可能会更改 在解决这个问题一段时间后 找到
  • Elasticsearch Nest 通配符查询(带空格)

    简洁版本 我想使用 Nest 编写一个弹性搜索查询来获取完整的索引项 ContentIndexables在我的例子中作为我的自定义类型 已被索引 该查询受 some string 术语查询的约束 即 String StartsWith 其中
  • 为 Logstash 中的新字段设置 Elasticsearch Analyzer

    通过使用GROK filter 我们可以向Logstash添加新字段 但是 我想知道如何为该特定字段设置分析器 例如 我有一个新的 id 字段 其中有一个字段 例如a b 但是 Elasticsearch 附带的普通分析器会将其分解为a a
  • Twitter 的推文按钮有回调吗?

    有没有办法在 Twitter 的推文按钮上注册回调 我希望能够跟踪我网站上的哪些特定用户在 Twitter 上发布了链接 我无法添加 onClick 事件 因为它是跨域 iFrame 还有其他想法吗 我见过一种方法 https stacko
  • 自动完成建议中的输出字段

    当我想在 elasticsearch 中索引文档时 会发生此问题 message MapperParsingException failed to parse nested IllegalArgumentException unknown
  • ElasticSearch - 尝试在 Windows 上启动服务时出错

    昨天 我在 Windows Server 2012 R2 上完成了 ElasticSearch 的安装 并且能够正常启动 ElasticSearch 服务 今天 我安装了 Kibana 和 X Pack 但在尝试启动 ElasticSear
  • 如何在 Twitter Card 中传递动态图像路径?

    我在用
  • 如何跟踪推文按钮点击次数?

    我想通过 Google Analytics 跟踪推文按钮点击 但推文按钮是一个包含来自另一个域的内容的 iframe 是否有一些技巧可以为推文按钮点击添加回调 或者 您可以简单地将事件添加到您的 div 中 然后等待该 div 被单击 例如
  • Facet从elasticsearch中的对象获取所有键

    假设我有以下文档 title Some Title options key5 1 key3 0 key1 1 title Some Title options key2 0 key3 0 key5 1 我想从中获取所有钥匙options使用

随机推荐