综合案例 您所在的位置:网站首页 数据商店 综合案例

综合案例

2023-08-04 02:10| 来源: 网络整理| 查看: 265

案例背景介绍

        在日益激烈的商业竞争中,在线DVD租赁商店的决策者都迫切地需要更加准确的战略决策信息。每个在线DVD租赁商店的数据都存储在数据库中,因此该数据库中拥有海量的数据,并不缺乏足够的信息,但是这些数据并不是战略决策需要的信息。虽然这些海量数据对于在线DVD租赁商店的运作是非常有用的,但是对于商业的战略决策和目标制定的作用是微乎其微的。

        对于在线DVD租赁商店的决策者来说,他们需要从多个不同的商业角度观察数据,例如时间、电影、演员、用户等角度观察数据,并进行相关的分析得出决策,但是数据库中的数据不适合从多个角度进行分析,无法得出战略决策。然而,数据仓库支持复杂的分析操作,侧重于决策支持,并且还提供直观易懂的查询结果,因此我们需要基于数据库sakila创建一个DVD租赁商店数据仓库,并将sakila数据库中的数据加载到数据仓库中,便于在线DVD租赁商店的决策者对数据进行分析得出商业决策。

数据仓库的架构模型

        数据仓库sakila_dw的架构模型是一个星型模型,其中dim_film表、dim_customer表、dim_actor表、dim_store表、dim_staff表、dim_date表以及dim_time表均为维度表;fact_rental表为事实表。

 数据库sakila介绍

        数据库sakila中一共含有十六张数据表,分别是actor(演员)表、address(地址)表、category(类别)表、city(城市)表、country(国家)表、customer(顾客)表、film(电影)表、film_actor(演员所属电影)表、film_category(电影所属的类别)表、film_text(电影描述)表、inventory(库存)表、language(语言)表、payment(付款)表、rental(租赁)表、staff(工作人员)表以及store(商店)表。 

数据库sakila中数据表之间的关系:

构建DVD租赁商店数据仓库

       我们基于数据库sakila构建一个星型模型的DVD租赁商店数据仓库,并命名为sakila_dw。数据仓库sakila_dw中的事实表fact_rental是根据数据库sakila中的数据表rental创建的;维度表是根据数据表sakila中数据表的分类创建的,即从人员、时间、地点以及事件四个角度进行创建数据仓库sakila_dw的维度表,具体如下:

        从人员角度角度创建维度表dim_customer和维度表dim_staff,分别表示租赁业务中的客户和员工;从时间角度创建维度表dim_date和维度表dim_time,用于记录所有DVD的租赁时间和归还时间;从地点角度创建维度表dim_store,用于记录DVD光盘是从哪个商店租赁的;从事件角度创建维度表dim_actor和维度表dim_film,其中维度表dim_actor用于记录演员的基本信息,维度表dim_film用于记录电影的基本信息。由于电影是租赁和归还的实际对象,因此维度表dim_film应与事实表fact_rental关联。一部电影是由多位演员出演,所以会有桥接表dim_film_actor_bridge,该表将电影与演员相关联。

        数据仓库sakila_dw中的每个维度表(dim_date和dim_time除外)都对应着数据库sakila中某个数据表,例如维度表dim_store对应着数据表store、维度表dim_actor对应着数据表actor。

加载日期数据至日期维度表 

通过Kettle工具加载日期数据至dim_date日期维度表。

1.打开Kettle工具,创建转换 

使用Kettle工具,创建一个转换,并添加生成记录控件、增加序列控件、JavaScript代码控件、表输出控件以及Hop跳连接线,具体如图所示。

2.配置生成记录控件 

在“限制”处添加生成的日期,默认为10,这里改为3650,即生成10年的日期(10*365);在“字段”框添加字段language(语言)、country_code(国家码)、initial_date(初始化的日期),对生成的日期进行初始化,具体如图所示。

 3.配置增加序列控件

双击“增加序列”控件,进入“增加序列”配置界面,并在“值的名称”处将valuename改为DaySequence,即增加一列日期字段,后续用于改变“生成记录”控件生成的日期,如图所示。 

4.配置JavaScript控件 

 双击“JavaScript”控件,进入“JavaScript”配置界面,勾选“兼容模式?”处的复选框,使得JavaScript代码控件的兼容性更强;在Java Script代码框中编写代码(代码见下)。单击【获取变量】按钮,将代码中定义的变量添加至字段框中。 “JavaScript代码”控件的具体配置效果如图所示,单击【确定】按钮,完成“JavaScript代码”控件的配置。

注意:key_data的长度要限定,不然会报错。

//Script here //生成locale var locale = new java.util.Locale(language.getString(),country_code.getString()); //生成Calendar var calendar = new java.util.GregorianCalendar(locale); //设置时间 calendar.setTime(initial_date.getDate()); //设置日历为当前日期 calendar.add(calendar.DAY_OF_MONTH,DaySequence.getInteger()-1); //获取日期 var date = new java.util.Date(calendar.getTimeInMillis()); //生成短日期 var date_short = java.text.DateFormat.getDateInstance(java.text.DateFormat.SHORT,locale).format(date); //生成中日期 var date_medium = java.text.DateFormat.getDateInstance(java.text.DateFormat.MEDIUM,locale).format(date); //生成长日期 var date_long = java.text.DateFormat.getDateInstance(java.text.DateFormat.LONG,locale).format(date); //生成全日期 var date_full = java.text.DateFormat.getDateInstance(java.text.DateFormat.FULL,locale).format(date); //简单格式化 var simpleDateFormat = java.text.SimpleDateFormat("D",locale); //天在年的第几天 var day_in_year = simpleDateFormat.format(date); //建立格式器 simpleDateFormat.applyPattern("d"); //天在月的第几天 var day_in_month = simpleDateFormat.format(date); simpleDateFormat.applyPattern("EEEE"); //星期的名称 var day_name = simpleDateFormat.format(date); simpleDateFormat.applyPattern("E"); //星期的缩写 var day_abbreviation = simpleDateFormat.format(date); simpleDateFormat.applyPattern("ww"); //一年的第几周 var week_in_year = simpleDateFormat.format(date); simpleDateFormat.applyPattern("W"); //一月的第几周 var week_in_month = simpleDateFormat.format(date); simpleDateFormat.applyPattern("MM"); //月份 var month_number = simpleDateFormat.format(date); simpleDateFormat.applyPattern("MMMM"); //月的名称 var month_name = simpleDateFormat.format(date); simpleDateFormat.applyPattern("MMM"); //月的缩写 var month_abbreviation = simpleDateFormat.format(date); simpleDateFormat.applyPattern("yy"); //两位的年 var year2 = simpleDateFormat.format(date); simpleDateFormat.applyPattern("yyyy"); //四位的年 var year4 = simpleDateFormat.format(date); //季度名称 var quarter_name = "Q"; //季度 var quarter_number; switch(parseInt(month_number)){ case 1:case 2:case 3:quarter_number = "1";break; case 4:case 5:case 6:quarter_number = "2";break; case 7:case 8:case 9:quarter_number = "3";break; case 10:case 11:case 12:quarter_number = "4";break; } quarter_name += quarter_number; //定义常量 var yes = "yes"; var no = "no"; //获取周的第一天 var first_day_of_week = calendar.getFirstDayOfWeek(); var day_of_week = java.util.Calendar.DAY_OF_WEEK; //判断是否为周的第一天 var is_first_day_in_week; if(first_day_of_week == calendar.get(day_of_week)){ is_first_day_in_week = yes; }else{ is_first_day_in_week = no; } //日历的下一天 calendar.add(calendar.DAY_OF_MONTH,1); //获取下一天 var next_day = new java.util.Date(calendar.getTimeInMillis()); //判断是否周的最后一天 var is_last_day_in_week; if(first_day_of_week == calendar.get(day_of_week)){ is_last_day_in_week = yes; }else{ is_last_day_in_week = no; } //判断是否为月的第一天 var is_first_day_in_month; if(day_in_month == 1){ is_first_day_in_month = yes; }else{ is_first_day_in_month = no; } //判断是否为月的最后一天 var is_last_day_in_month; if(java.text.SimpleDateFormat("d",locale).format(next_day)==1){ is_last_day_in_month = yes; }else{ is_last_day_in_month = no; } //年_季度 var year_quarter = year4 + "-" + quarter_name; //年_月份 var year_month_number = year4 + "-" + month_number; //年_月缩写 var year_month_abbreviation = year4 + "-" + month_abbreviation; //日期代理剑(唯一键) var date_key = year4 + month_number + (day_in_month


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有