Pentaho学习笔记

2023-11-05

一、       Pentaho 整体架构

 

cc

 

 

 

二、       Client tools

1.        Report Designer

报表创建工具。如果想创建复杂数据驱动的报表,这是合适工具。

2.        Design Studio

这是基于eclipse的工具,你可以使用它来创建手工编辑的报表或分析视图xaction 文件,一般用来对在report designer中无法增加修改的报表进行修改。

3.        Aggregation Designer

帮助改善Mondrian cube 性能的图形化工具。

4.        Metadata Editor

用来添加定制的元数据层到已经存在的数据源。一般不需要,但是它对应业务用户在创建报表时解析数据库比较容易。

5.        Pentaho Data Integration

这是kettle etl工具。

6.        Schema Workbench

帮助你创建rolap的图形化工具。这是为分析准备数据的必须步骤。

 

三、       Pentaho BI suit community editon安装

硬件要求:

RAM: At least 2GB

Hard drive space: At least 1GB

Processor: Dual-core AMD64 or EM64T

软件要求:

  需要JRE 1.5版本,1.4版本已经不再支持。

 

修改默认的端口8080,打开\biserver-ce\tomcat\conf目录下的server.xml文件,修改<connector port=8080为你想要的端口号。同时在这部分可以调整Apache Tomcat参数。在修改了该端口号后,必须同时修改\tomcat\webapps\pentaho\WEB-INF目录下的web.xml文件中的<context-param><param-name>base-url</param-name><param-value>http://localhost:8080/pentaho</param-value></context-param>中的端口号。否则administration-console中不能连接到bi server。

四、       配置数据库连接

如果要是pentaho bi server能连接到关系数据库,需要将相应数据库driver的jar包拷贝到server/biserver-ce/tomcat/common/lib目录。

    为了能在administration console中创建数据库连接并测试,需要将相应的数据库driver的jar包拷贝到server/administration console/jdbc目录。下面是具体关系数据库连接设置说明。

1、连接oracle数据库。

需要将oracle的driver类class12.jar包拷贝到/Pentaho/server/enterprise-console-server/jdbc/或/biserver-ee/server/enterprise-console-server/jdbc/

/Pentaho/server/bi-server/tomcat/common/lib/或/biserver-ee/server/bi-server/tomcat/common/lib/目录。

执行\Pentaho\Server\administration-console目录下的start-pac.bat启动admin console bi server

 

在Adminstrator console中配置数据库连接:

 在iE中输入http://localhost:8099/后进入管理界面,点左边的administrator,在右边窗口中点database connection进入下面的界面。

在name中输入要创建的数据库连接的名称,在driver class中选择要使用的driver类,user name中输入访问数据库的用户、password中输入相应的密码,在url中输入访问数据库的连接信息:jdbc:oracle:thin:@xzq:1521:oradata。在@之前的是固定信息,@之后分别是服务器名称或IP:端口号:数据库服务名。

2、连接MS Sql server数据库

在iE中输入http://localhost:8099/后进入管理界面,点左边的administrator,在右边窗口中点database connection进入下面的界面。

在name中输入要创建的数据库连接的名称,在driver class中选择要使用的driver类,user name中输入访问数据库的用户、password中输入相应的密码,在url中输入访问数据库的连接信息:jdbc:Microsoft:sqlserver://localhost:41433;DatabaseName=GOSLDW。//前的字符是固定的,//后是数据库服务器名或ip地址:端口号;DatabaseName=数据库名。

五、       Report Designer创建报表

5.1.    创建步骤

第一步:定义数据源,创建dataset

第二步:定义report layout,report layout有一组band构成,包括reportheader、report footer、group header、group footer以及detail构成。

第三步:部署报表到BI server.

5.2.    创建report title

在左边的工具栏上拖一个label报表元素到reportheader band中,双击label报表元素输入你想要的report title,如图5-2。你可以在右边的属性窗口中对该title进行属性定义,包括字体大小、颜色、样式等。

图5-2 创建report title

5.3.    创建column header

在report title下加几个label报表元素,构成你需要的columnheader,如图5.3所示。

图5-3 创建column header

5.4.    创建report detail

报表的Detail本身将产生报表的明细记录,这些记录有dataset提供,因此需要将dataset中的字段拖入report detail band即可,如图5-4。

图5-4 产生reportdetail

5.5.    创建report summary

在 report footer band加上汇总元素的描述标签和相应的汇总计算字段,如图 5-5所示。

这里的关键是需要生产汇总计算字段,图中生成了两个library count 和total library size,要产生这两个汇总字段,需要在右边data页的function中增加function字段,分别利用了count(running)和summary(running)函数

5.6.    画布大小设置

点击菜单file->pagesetup,出现图5.6所示的界面,在该界面中可以设置画布的大小

图5.6

5.7.    创建图表

所有图表都有一个showlabel属性,默认是hidelabel,在这种情况下,图表上不会显示相应的值,图表上能显示的值一般有三种情况,分别是0、1、2(对pie chart有3),分别表示系列的描述、category描述、项值,如果需要组合显示,可以采用{0},{2}这样的格式来表示。

5.7.1.   Bar chart

Bar chart对比较不同类别数据的大小是有用的。

在左边的工具按钮中拖入chart图标到report header,如图5.7.1

图5.7.1

双击该图出现图5.7.2所示的属性窗口

图5.7.2 bar chart属性设置

在左边窗口中设置相关的显示属性,在右边窗口中指定显示的数据字段。这样就完成了图形报表的创建。

技巧:

   Pentaho中的数据集是同报表绑定的,如果想在同一报表中显示多张chart报表,需要利用sub report,在不同的sub report中分别创建报表完成。

5.7.2.   区域图(Area chart)

区域图用于比较两个或多个数据集间的差异是有用的。

5.7.3.   线性图(line chart)

线性图对分析发展趋势是有用的。

注意,堆积和堆积百分比(stackand stack percent)不能用于linechart。

5.7.4.   饼图(pie chart)

饼图一般用来分析不同category占总值的占比分析。

饼图有一个labelformat属性,该属性值有以下几种:

{0}:series name,

{1}::series raw value

{

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Pentaho学习笔记 的相关文章

随机推荐