一、 Pentaho 整体架构
cc
二、 Client tools
1. Report Designer
报表创建工具。如果想创建复杂数据驱动的报表,这是合适工具。
2. Design Studio
这是基于eclipse的工具,你可以使用它来创建手工编辑的报表或分析视图xaction 文件,一般用来对在report designer中无法增加修改的报表进行修改。
3. Aggregation Designer
帮助改善Mondrian cube 性能的图形化工具。
4. Metadata Editor
用来添加定制的元数据层到已经存在的数据源。一般不需要,但是它对应业务用户在创建报表时解析数据库比较容易。
5. Pentaho Data Integration
这是kettle etl工具。
6. Schema Workbench
帮助你创建rolap的图形化工具。这是为分析准备数据的必须步骤。
三、 Pentaho BI suit community editon安装
硬件要求:
RAM: At least 2GB
Hard drive space: At least 1GB
Processor: Dual-core AMD64 or EM64T
软件要求:
需要JRE 1.5版本,1.4版本已经不再支持。
修改默认的端口8080,打开\biserver-ce\tomcat\conf目录下的server.xml文件,修改<connector port=8080为你想要的端口号。同时在这部分可以调整Apache Tomcat参数。在修改了该端口号后,必须同时修改\tomcat\webapps\pentaho\WEB-INF目录下的web.xml文件中的<context-param><param-name>base-url</param-name><param-value>http://localhost:8080/pentaho</param-value></context-param>中的端口号。否则administration-console中不能连接到bi server。
四、 配置数据库连接
如果要是pentaho bi server能连接到关系数据库,需要将相应数据库driver的jar包拷贝到server/biserver-ce/tomcat/common/lib目录。
为了能在administration console中创建数据库连接并测试,需要将相应的数据库driver的jar包拷贝到server/administration console/jdbc目录。下面是具体关系数据库连接设置说明。
1、连接oracle数据库。
需要将oracle的driver类class12.jar包拷贝到/Pentaho/server/enterprise-console-server/jdbc/或/biserver-ee/server/enterprise-console-server/jdbc/
/Pentaho/server/bi-server/tomcat/common/lib/或/biserver-ee/server/bi-server/tomcat/common/lib/目录。
执行\Pentaho\Server\administration-console目录下的start-pac.bat启动admin console或 bi server。
在Adminstrator console中配置数据库连接:
在iE中输入http://localhost:8099/后进入管理界面,点左边的administrator,在右边窗口中点database connection进入下面的界面。
在name中输入要创建的数据库连接的名称,在driver class中选择要使用的driver类,user name中输入访问数据库的用户、password中输入相应的密码,在url中输入访问数据库的连接信息:jdbc:oracle:thin:@xzq:1521:oradata。在@之前的是固定信息,@之后分别是服务器名称或IP:端口号:数据库服务名。
2、连接MS Sql server数据库
在iE中输入http://localhost:8099/后进入管理界面,点左边的administrator,在右边窗口中点database connection进入下面的界面。
在name中输入要创建的数据库连接的名称,在driver class中选择要使用的driver类,user name中输入访问数据库的用户、password中输入相应的密码,在url中输入访问数据库的连接信息:jdbc:Microsoft:sqlserver://localhost:41433;DatabaseName=GOSLDW。//前的字符是固定的,//后是数据库服务器名或ip地址:端口号;DatabaseName=数据库名。
五、 Report Designer创建报表
5.1. 创建步骤
第一步:定义数据源,创建dataset
第二步:定义report layout,report layout有一组band构成,包括reportheader、report footer、group header、group footer以及detail构成。
第三步:部署报表到BI server.
5.2. 创建report title
在左边的工具栏上拖一个label报表元素到reportheader band中,双击label报表元素输入你想要的report title,如图5-2。你可以在右边的属性窗口中对该title进行属性定义,包括字体大小、颜色、样式等。
图5-2 创建report title
5.3. 创建column header
在report title下加几个label报表元素,构成你需要的columnheader,如图5.3所示。
图5-3 创建column header
5.4. 创建report detail
报表的Detail本身将产生报表的明细记录,这些记录有dataset提供,因此需要将dataset中的字段拖入report detail band即可,如图5-4。
图5-4 产生reportdetail
5.5. 创建report summary
在 report footer band加上汇总元素的描述标签和相应的汇总计算字段,如图 5-5所示。
这里的关键是需要生产汇总计算字段,图中生成了两个library count 和total library size,要产生这两个汇总字段,需要在右边data页的function中增加function字段,分别利用了count(running)和summary(running)函数
5.6. 画布大小设置
点击菜单file->pagesetup,出现图5.6所示的界面,在该界面中可以设置画布的大小
图5.6
5.7. 创建图表
所有图表都有一个showlabel属性,默认是hidelabel,在这种情况下,图表上不会显示相应的值,图表上能显示的值一般有三种情况,分别是0、1、2(对pie chart有3),分别表示系列的描述、category描述、项值,如果需要组合显示,可以采用{0},{2}这样的格式来表示。
5.7.1. Bar chart
Bar chart对比较不同类别数据的大小是有用的。
在左边的工具按钮中拖入chart图标到report header,如图5.7.1
图5.7.1
双击该图出现图5.7.2所示的属性窗口
图5.7.2 bar chart属性设置
在左边窗口中设置相关的显示属性,在右边窗口中指定显示的数据字段。这样就完成了图形报表的创建。
技巧:
Pentaho中的数据集是同报表绑定的,如果想在同一报表中显示多张chart报表,需要利用sub report,在不同的sub report中分别创建报表完成。
5.7.2. 区域图(Area chart)
区域图用于比较两个或多个数据集间的差异是有用的。
5.7.3. 线性图(line chart)
线性图对分析发展趋势是有用的。
注意,堆积和堆积百分比(stackand stack percent)不能用于linechart。
5.7.4. 饼图(pie chart)
饼图一般用来分析不同category占总值的占比分析。
饼图有一个labelformat属性,该属性值有以下几种:
{0}:series name,
{1}::series raw value
{