拓闻

2023-11-12

拓闻 <wbr>| <wbr>万级维度、千亿级数据,看我Eagles实时检索分析引擎拓闻 <wbr>| <wbr>万级维度、千亿级数据,看我Eagles实时检索分析引擎大数据时代的来临为众多企业带来了更多的全新的发展机遇。而搜索引擎已经成为大数据领域的一个核心应用,其重要性不言而喻。很多公司在大数据离线统计分析方面已经具备了一定的能力。但是,很多应用场景往往要求在数秒内完成对几亿、几十亿甚至几百上千亿的数据分析,从而达到不影响用户体验的目的。如何能够及时有效的获取分析结果提高工作效率,这是许多分析人员在面对大数据所不得不面临的问题。拓闻 <wbr>| <wbr>万级维度、千亿级数据,看我Eagles实时检索分析引擎 实时检索分析引擎Eagles,是DATATOM研发的为大数据检索、分析业务提供一套实时的、多维的、交互式的查询、统计、分析系统,它是DANA智能数据开发者服务中一个核心模块,具有高扩展性、高通用性、高性能的特点, 能够为公司各个产品在大数据的统计分析方面提供完整的解决方案,让万级维度、千亿级数据下的秒级统计分析变为现实。

今天,小拓结合Eagles产品特性,给大家介绍这款产品。

1.易管理性

Eagles自带Web的管理控制台,方便进行远程维护和管理。

拓闻 <wbr>| <wbr>万级维度、千亿级数据,看我Eagles实时检索分析引擎2. 高扩展性

Eagles拥有非常灵活的扩展性,您只需添加一个个新节点,即可轻松应对更高级别的数据量,可以扩展到上百台服务器,高效处理PB级数据。

数据索引库可以设置任意多分片,分片会在集群节点之间平均的负载, 当集群扩容或缩小的时候,Eagles会自动在节点之间迁移分片,以保证集群的负载平衡。

用户提交查询请求时,请求也会分发到每个涉及的节点,在多个分片中并发查询, Merge操作会选择其中一个负载较轻的分片中进行,此特性在海量数据的时候优势就体现的非常明显。

拓闻 <wbr>| <wbr>万级维度、千亿级数据,看我Eagles实时检索分析引擎3.高可用性

Eagles拥有非常完善的故障异常处理机制,任何节点故障不影响系统正常使用。因Eagles采用对等节点机制,集群内部自动检测节点的增加、失效和恢复,并重新组织索引。

同时索引库支持设置多副本机制,任一索引分片都在不同的节点上有副本,任意节点故障系统会在毫秒级检测到异常并启动副本复制,不影响应用系统的正常使用。

拓闻 <wbr>| <wbr>万级维度、千亿级数据,看我Eagles实时检索分析引擎4.多种数据源支持

Eagles通过整合Crab数据收集引擎,能够支持多种数据源的定时收集,如传统ETL工具,网页Spider, 数据库,文件系统,邮件,RabbitMQ消息队列, Log 等数据源,索引可完全自定义索引结构。

拓闻 <wbr>| <wbr>万级维度、千亿级数据,看我Eagles实时检索分析引擎5.实时数据分析

Eagles提供了丰富的聚合/分类算法,利用其冗长但是强大的Aggregation DSL可以表达出比SQL还要复杂的聚合逻辑, 为数据分析提供了有力的支撑, 目前Eagles支持:

1)域的折叠与融合

2)百分位等级聚合,该功能展示了观测值在某个特定值之下的百分率

3)地理范围聚合,该功能提供了一个覆盖了所有位置值的范围框图

拓闻 <wbr>| <wbr>万级维度、千亿级数据,看我Eagles实时检索分析引擎  (图:使用Eagles统计热点违停区域)

6.数据地图搜索

Eagles内置Geo字段支持,只要文档中包含空间信息字段,即可使用Eagles搜索API进行空间搜索、距离搜索、范围搜索、空间统计等高级功能。

拓闻 <wbr>| <wbr>万级维度、千亿级数据,看我Eagles实时检索分析引擎(图:使用Eagles实现巡逻范围预警)

7.Schema-Free

Eagles既可以搜索、也可以保存数据。它提供了一种半结构化、不依赖schema并且基于JSON的模型,你可以直接传入原始的JSON文档,Eagles会自动地检测出你的数据类型,并对文档进行索引。你也可以对schema映射进行定制,以实现特殊的自定义需求,例如对单独的字段或文档进行boost映射,或者是定制全文搜索的分析方式等。

8.多语言分词

Eagles内置了多种语言的分词器,目前内置英文、中文、日文、俄文、法文、拼音分词,不同的分词器有不同的分词算法,用户可以根据自己的需求选择适合的分词器。词典支持自定义,以提升分词的准确率。

9.Query DSL

完整的支持了基于JSON的QueryDSL通用查询框架,QueryDSL是一个Java开源框架用于构建类型安全的SQL查询语句。它采用API代替拼凑字符串来构造查询语句。它有几大特点:

1)QueryDSL仅仅是一个通用的查询框架,专注于通过Java API构建类型安全的SQL查询。

2)QueryDSL可以通过一组通用的查询API为用户构建出适合不同类型ORM框架或者是SQL的查询语句,也就是说QueryDSL是基于各种ORM框架以及SQL之上的一个通用的查询框架。

3)借助QueryDSL可以在任何支持的ORM框架或者SQL平台上以一种通用的API方式来构建查询。前QueryDSL支持的平台包括JPA,JDO,SQL,Java Collections,RDF,Lucene,Hibernate Search。

10.兼容SQL

除了QueryDSL 查询语法的支持,Eagles还支持类SQL的查询方式,让熟悉数据库的你轻松上手,目前支持常用语法 Select, Delete, Where, Order By, Group By, And/Or, Like,Count, Sum, Between等。

拓闻 <wbr>| <wbr>万级维度、千亿级数据,看我Eagles实时检索分析引擎11.RESTFul 跨平台接口

Eagles支持RESTful的API,可以使用JSON通过HTTP调用它的各种功能,包括搜索、分析与监控。此外,它还为Java、PHP、Perl、Python以及Ruby等各种语言提供了原生的客户端类库。

12.与Hadoop兼容和集成

DATATOM将其在数据检索处理上的丰富经验与 Hadoop 开源平台高效整合。Eagles实时搜索引擎与Hadoop无缝集成, MapReduce 的引入大大扩展了系统在数据分析方面的扩展能力; Eagles 机器数据挖掘引擎是基于Hadoop平台进行数据挖掘与分析, Eagles将分片的信息暴露给Hadoop,以此可以实现协同定位。Job的任务会在每个Eagles分片所在的同一台机器上运行, Eagles能够提供近乎实时的响应速度,这极大的改善了Hadoop job的执行速度以及执行的各种开销.。

检索引擎的功能和性能决定了大数据系统的响应能力和可用性,同时很多大数据分析和挖掘操作也是依赖于底层实时查询技术,因此在海量数据规模下,能获得秒级的响应是大数据应用系统的一个关键指标。

拓闻 <wbr>| <wbr>万级维度、千亿级数据,看我Eagles实时检索分析引擎而应对万级维度、千亿级数据,看我EAGLE实时检索分析引擎大显神威吧。






http://blog.sina.com.cn/s/blog_882057360102vxr5.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

拓闻 的相关文章

  • 嵌入式编写TCP连接过程

    先来一个三次握手和四次挥手 嵌入式连接过程 1 af 为地址族 Address Family 也就是 IP 地址类型 常用的有 AF INET 和 AF INET6 AF 是 Address Family 的简写 INET是 Inetnet
  • Python爬虫常用库及解析库解析

    作者 禅与计算机程序设计艺术 1 简介 随着互联网的快速发展 越来越多的人开始使用网络购物 网络交易 微博阅读等方式进行日常生活 然而在这样的大环境下 如何从海量的数据中提取有价值的信息并有效整合到一起成为困难重重的事情 作为一名具有高度职
  • java jsp公共异常页面_JSP页面的异常处理

    对于jsp页面错误处理这里大致有两种方式 一 在Web xml中配置全局的错误异常处理 即凡是该项目下 即虚拟路径下的所有文件 的任意一个文件错误或者异常 都会跳到指定的错误处理页面 全局的错误处理可以处理两种类型的错误 一种是HTTP代码
  • gin框架10--XML/JSON/YAML/ProtoBuf 渲染

    gin框架10 XML JSON YAML ProtoBuf 渲染 介绍 案例 说明 介绍 本文主要介绍gin 中的 XML JSON YAML ProtoBuf 等常见渲染方法 以及其测试结果 案例 源码 package main imp
  • 构造任意多个HashCode相同的字符串

    在Java中字符串的HashCode的实现如下 JDK8 public int hashCode int h hash if h 0 value length gt 0 char val value for int i 0 i lt val
  • Spark提交参数说明和常见优化

    会用spark 会调api和能用好spark是两回事 在进行开发的过程中 不仅要了解运行原理 还要了解业务 将合适的方法和业务场景合适的结合在一起 才能发挥最大的价值 spark submit 进入spark的home目录 执行以下命令查看
  • macOS通过钥匙串访问找回WiFi密码的详细教程

    如果您忘记了Mac电脑上的WiFi密码 可以通过钥匙串访问来找回它 具体步骤如下 1 打开Mac电脑的 启动台 然后在其他文件中找到 钥匙串访问 2 运行 钥匙串访问 应用程序 点击左侧的 系统 然后在右侧找到要查看的WiFi网络名称 如果
  • 在linux上安装与卸载MySQL【非常详细】

    文章目录 一 安装MySQL 1 从网上下载文件的wget命令 2 下载MySQL的repo源 3 安装MySQL的rpm包 4 检查是否有两个repo源 5 安装MySQL 6 启动MySQL 7 登录MySQL 8 登录并切换数据库 查
  • Leetcode 题组 28

    112 路径总和 给你二叉树的根节点 root 和一个表示目标和的整数 targetSum 判断该树中是否存在 根节点到叶子节点 的路径 这条路径上所有节点值相加等于目标和 targetSum 叶子节点 是指没有子节点的节点 示例 1 输入
  • java 在阻塞时终结学习笔记

    一个线程可以处于以下四种状态 1 新建 new 当线程被创建时 它只会短暂地处于这种状态 此时它已经分配了必需的系统资源 并执行了初始化 此时刻线程已经有资格获得CPU时间了 之后调度器将把这个线程转变为可运行状态或阻塞状态 2 就绪 Ru
  • Python机器学习(三)--决策树算法

    Python机器学习 三 决策树算法 原创 2014年07月14日 13 57 55
  • C语言中的fprintf和printf区别在哪?

    原型 fprintf的函数原型为 int fprintf FILE stream const char format argument 而printf的函数原型为 int printf const char format argument
  • uniapp使用绝对定位被父元素截断问题

    在做uniapp开发时真机运行的时候使用绝对定位 会被他限制在他整个的父元素之内 本来这两块是做了两个子组件 但是 点击问号的时候就会出现上述问题 弹框永远显示不全 解决方案 将这个弹框移到父组件中 如index vue 然后使用一个div
  • jdk下载百度云(windows×64-7,8,10)

    之前找了很久 好多都要很多积分 所以我就给大家整理到百度云盘 https pan baidu com s 1UgiZf6R8PNtnlTDNW N2Kw 提取码 o6cp
  • 只有持续的变革和创新才是CRM成功的关键

    这两年来 我目睹了众多的企业在进行CRM的尝试和体验 也亲历了众多的企业对CRM成功与失败的讨论 甚至于有很多关于CRM失败的项目和言论 让更多后面的企业停止了尝试的脚步 而这一切 不应该只归罪与一个CRM系统 或者一个CRM项目 而要更多
  • error: CreateProcess: No such file or directory的解决方法

    办公的笔记本上先装有qnxIDE的700环境 然后再用Eclipse 搭建了一个qnx710的环境 刚搭建完qnx710的时候是可以编译通过的 之后第二天再开机编译Eclipse 710就编译不过了 报错就是 error CreatePro
  • WiFi技术概述

    1 概述 WLAN是无线局域网络的简称 全称为Wireless Local Area Networks 是一种利用无线技术进行数据传输的系统 该技术的出现能够弥补有线局域网络之不足 以达到网络延伸之目的 Wi Fi是无线保真的缩写 英文全称
  • spring加载一个或者多个properties配置文件方法

    在项目中有些参数需要经常修改 或者后期需要修改 比如IP 调用别人的接口地址 数据库地址及帐号密码等 那么我们就不能把这些参数写死在代码里 虽然也可以在代码里改 但是如果是不懂代码的运维人员去现场部署项目又怎么改你的代码 那我们最好把这些参
  • 关于Discuz X3.2如何设置邮箱验证的具体方法

    原文地址 兔子酱老师好久没发文章了的 是因为最近在学习和熟悉Discuz社区程序 这个PHP程序是一木主编推荐给我的 妹子我简单操作了几下 很是喜欢 这个程序目前的版本是X3 2 带有很多好玩的功能 听说这个程序早几年被腾讯收购了的 所以

随机推荐

  • 控制疫情蔓延嵌入式物联网能帮大忙

    联合国所订定之永续发展目标之一 便是针对防治传染病的蔓延做好准备 在新型冠状病毒 COVID 19 流行期间 防疫已成为当前最重要目标 科技在对抗传染病方面扮演重要角色 而物联网 IoT 相关技术正是我们重要的防疫武器 降低成本 自发自主性
  • matlab 求单/多元函数极值

    matlab 求单 多元函数极值 单元函数极值 平时如果手算的话 就会先求导数 再求驻点 最终代值算出极值 如果用matlab代码求的话 就可以减少很多不必要的计算 fun inline 0 5 x exp x 2 ezplot fun 0
  • java复习第7天---7.4---IO流---递归、文件过滤器

    java复习第7天 7 4 IO流 递归 文件过滤器 目录 文章目录 1 递归 1 1 递归概述和分类 2 过滤器 后记 内容 1 递归 1 1 递归概述和分类 递归 在方法内调用自己 递归分类 递归分为直接递归和间接递归 直接递归 方法内
  • python的gzip库解压某一路径下的所有.gz文件

    今天 做机器学习 解压数据集的时候 参考大佬咯咯哒鸭的文章想到的方法 代码如下 encoding utf 8 Author Mr Pan 学狂 finish time 2022 2 15 import sys import gzip imp
  • 入门级题解5. 最长回文子串

    题目 给你一个字符串 s 找到 s 中最长的回文子串 思路 找到最小的那个字串 aba或者aa 然后向两边发散 伪代码 for 1 s length 第一种情况 if s i s i 1 aa bb cc形式 第二种情况 if s i 1
  • layui跨域问题

    由于浏览器存在同源策略 所以如果 layui 里面含图标字体文件 所在的地址与你当前的页面地址不在同一个域下 即会出现图标跨域问题 所以要么你就把 layui 与网站放在同一服务器 要么就对 layui 所在的资源服务器的 Response
  • JavaWeb中文件上传与下载

    JavaWeb中文件上传与下载 一 文件上传 1 文件上传的应用 比如个人信息的管理 上传头像 比如商品信息的管理 上传商品的图片 这些都需要通过浏览器客户端将图片上传到服务器的磁盘上 文件上传原理 所谓的文件上传就是服务器端通过reque
  • idea中连接mysql插入成功数据 在navicat中刷新表格没有数据_数据分析之路——sql入门...

    1 基础知识点 数据库 按照数据结构来组织 存储和管理数据的仓库 是一个长期存储在计算机内的 有组织的 可共享的 统一管理的大量数据的集合 关系型数据库 采用关系模型来组织数据的数据库 其以行和列的形式存储数据 以便于用户理解 多张表 各表
  • 0xc000007b的解决办法(续)

    最后更新 2021 3 1 请大家首先确定已经按照原文的方法及步骤尝试过 但是还是没有解决问题再来看这篇文章 如果你还没有看过原文 请先看原文 http blog csdn net VBcom article details 6070705
  • 基于ZYNQ的掌上超声成像系统前端设计与实现

    http www doc88 com p 6631786569315 html
  • LeetCode刷题——排序(python语言)

    LeetCode刷题 排序 python语言 一 排序 顾名思义 排序就是将数组按照从小到大的顺序排列 广义的排序分为内部排序方法和外部排序方法 排序的方法有很多种 常用的冒泡 选择 插入 希尔 归并 快速 堆 计数 桶 基数排序 按照时间
  • 尝试将RxJava和Retrofit

    http www jianshu com p 2b0aeb6b6b61 安卓学习 记住3点 现在安卓发展的足够成熟 遇到的需求 别人也遇到了 遇到的bug别人遇见过了 不要想着走捷径 这些留下的人 不一定靠技术 也许靠脸皮 所以只管学习 快
  • [洛谷 P3376] 网络最大流

    题目链接 题目描述 如题 给出一个网络图 以及其源点和汇点 求出其网络最大流 输入格式 第一行包含四个正整数 n n n m m m s
  • Redis——zset类型详解

    概要 zset是有序集合 将zset中的members引入一个属性score 根据这个属性值来进行排序 其中members不可以重复 score可以重复 按照字典序排序 默认按照升序排序 有序集合中提供指定分数和元素范围查找 计算成员排名功
  • grep中加单引号与不加引号的区别

    今天写命令时本想查找最后带标点的句子 结果发现不带引号时无法识别 grep n exp grep n exp 貌似不加单引号无法达到我们想要的效果 上网搜了一下 有人说是因为引号的作用 其实这在shell变量中就有介绍 明显的是 这里单引号
  • 借力计算机视觉及深度学习,纽卡斯尔大学开发实时、自动化奶牛跛行检测系统

    本文首发自 HyperAI超神经微信公众号 内容一览 近期 纽卡斯尔大学联合费拉科学有限公司联合开发了一个针对多头奶牛的自动化 实时跛行检测系统 该系统能够按照跛行评分系统将奶牛进行分类 并且准确度高达 94 100 目前 该研究成果已发表
  • Spring Boot系列 - 3. SpringBoot项目学习汇总

    原文地址 https blog csdn net hemin1003 article details 53217489 网络上很多关于SpringBoot的资料和代码 但有一些根本运行不了 有些博主的代码还故意藏着掖着 一定要加他的微信才能
  • php 文件上传抓包,详解文件上传漏洞

    介绍 在现代互联网网站中 上传文件基本上是一种常见的功能 允许用户上传一些图片 视频以及其他类型的文件 如果网站出现文件上传漏洞 那么恶意用户就可以将可执行脚本程序上传到web服务器中 获得网站权限 进一步 gongji web服务器 当上
  • skywalking agent监控java服务

    一 前言 skywalking agent可以监控的服务类型有多种 python go java nodejs服务等都可以监控 现在通过java服务来演示skywalking agent的使用 并且是使用容器的方式实现 二 部署skywal
  • 拓闻

    大数据时代的来临为众多企业带来了更多的全新的发展机遇 而搜索引擎已经成为大数据领域的一个核心应用 其重要性不言而喻 很多公司在大数据离线统计分析方面已经具备了一定的能力 但是 很多应用场景往往要求在数秒内完成对几亿 几十亿甚至几百上千亿的数