• Pentaho安装配置 一 系统配置 1 Windows环境 试验环境为Windows 7 专业版 需要安装配置JDK 试验环境为1 7 0 67 打开计算机 系统属性 高级系统设置 环境变量 新建系统变量Path JAVA HOME bi
  • 前面说完了大数据开发平台的核心组件 作业调度系统 接下来讨论一下大数据开发平台的脸面之一 数据可视化平台 和调度系统一样 这又是一个很多公司可能想要自己造一个轮子的系统 数据可视化平台是什么 不过 慢着 先等一下 什么是数据可视化平台 我们
  • 大数据的出现带来了许多新的术语 但这些术语往往比较难以理解 因此 我们通过本文给出一个常用的大数据术语表 抛砖引玉 供大家深入了解 部分定义参考了相应的博客文章 A 聚合 Aggregation 搜索 合并 显示数据的过程 算法 Algor
  • 一 大数据基本概念 大数据Big Data是指大小超出了常用的软件工具在运行时间内可以承受的收集 管理和处理数据能力的数据集 大数据是目前存储模式与能力 计算模式与能力不能满足存储与处理现有数据集规模产生的相对概念 大数据的预处理 主要完成
  • 实例说明1 缓慢变化的维 如你注册csdn账号是所填写的地址 电话等资料 你的地址会变化的 但是很久才会变一次 这就是一个缓慢变化维 请参见Type1 Type2 Type3 Type1 全覆盖 保持最新数据 keep most recen
  • 2019年中国商业智能研究报告 为艾瑞咨询自主研究发布的商业智能行业研究报告 区别于传统商业智能 本报告聚焦于将人工智能及相关技术用于商业智能决策 梳理核心技术体系与行业应用价值 分类研究典型商业场景及环节中产品创新与服务升级等方面的实际落
  • 帕累托图是品管七大手法之一 是一种查找问题原因的分析方法 在质量管理中 我们常用帕累托图 排列图 来分析质量问题产生的主要因素 从而有重点的采取纠正措施 什么是帕累托图 帕累托图是一种按发生频率大小顺序绘制的特殊直方图 故又名排列图 主次图
  • 参照表一个常见的用途就是做数据的查询和检验 提供一个输入字段 如果输入字段里的值没有匹配上 就给对应的数据行做一个错误标志 下面使用城市和邮政编码查询做个例子 演示如何使用计算器步骤和查询步骤来判断地址和邮政编码是否匹配 完整的转换如下图
  • Metadata操作手册 1 Metadata基础知识 1 1 专业术语 元数据 1 1 1 公共仓库数据模型 公共数据仓库模型是一种规范标准 限定了数据仓库 商业智能 知识管理 端口 portal 技术之间交换的元数据的格式 Pentah
  • 第1章c闲话开源社区篇cc 第2章cWeb框架篇cc 2 1cStrutsc 2 2cSpringc 2 3cSeamcc 第3章c开源Web服务器c 3 1cApachecc 3 2cLighttpdcc 3 3cNginxc 第4章c应
  • 增量抽取 增量抽取只抽取自上次抽取以来数据库中要抽取的表中新增或修改的数据 在ETL使用过程中 增量抽取较全量抽取应用更广 如何捕获变化的数据是增量抽取的关键 对捕获方法一般有两点要求 准确性 能够将业务系统中的变化数据按一定的频率准确地捕