由北京灵蜂纵横软件有限公司研发的数据整合软件Beeload, 可对企业经营过程中所产生的各类业务数据进行抽取、清洗、转换和汇总,为数据中心实时提供高质量的数据。软件集成了数据转换、数据清洗、增量同步、WebService、工作流调度、任务定制调试、作业监控、SOA服务、数据安全、日志记录、统计分析等功能。
Beeload通过简单直观的图形操作界面,完全本地化的设计风格,帮助用户快速定义ETL规则。集成脚本开发环境,支持脚本的编辑、运行及调试,可充分满足企业的二次开发需求。
Beeload包含2个发行版本,分别为Beeload SE V6.0和Beeload EE V6.0。
Beeload SE即Beeload标准版,单机程序架构,任务的设计、运行及监控集成在一个模块内部。
Beeload EE即Beeload企业版,基于C/S架构,客户端软件(Beeload EE Client)负责任务配置及远程监控,服务器软件包含Beeload EE RJS和Beeload EE Monitor(仅Windows平台),分别负责任务运行和及本地监控,用户可以通过Client远程登录到RJS进行任务的发布,删除、调度或终止。
Beeload主要功能如下:
数据转换(数据集成)
1.支持数据接口如下表:
Oracle 8i / 9i / 10g / 11g |
DB2 8.1 / 9.5 |
Sybase ASE 12.5 / 15.7 |
SqlServer 2000 / 2005 / 2008 |
Mysql 4.0 / 5.0 |
Access 97 / 2000 / 2003 / 2007 |
Excel 97 / 2000 / 2003 |
Dbase 3 / 4 / 5 |
Foxbase2.1 |
Foxpro 6.0 |
Informix IDS 10.0 |
PostgreSQL 8.0 / 10.1 |
Gbase 8.3 |
DM 7.1 |
Oscar 7.0 |
InterBase 7.1 |
Lotus Notes 7 |
文本 |
XML |
WebService |
2.提供异步ETL过程处理模式,数据抽取、转换及装载过程并行执行,实现数据的高速处理,满足G、T级的数据转换;
3.支持各种字段级的映射转换,如类型转换、字段运算、参照转换、字符串处理、字符集转换、空值处理、日期 转 换、聚集运算、既定 取值、字段切分、字段合并等;
4.支持各类数据库大对象(LOB)的读写;
5.支持多字段的混合运算;
6.支持抽取数据的切分、过滤操作;
7.支持映射自动匹配,可自动完成异构数据库间数据类型的映射;
8.支持批量表的迁移映射,迁移信息包括表名、字段属性、主键属性、索引属性等;
9.支持表的动态创建,支持表名的动态生成;
10.支持数据库存储过程及函数的调用;
数据同步
Beeload提供以下数据同步处理机制:
时间戳
触发器
差异比对
Beeload通过同步ETL任务与定时机制的结合实现数据同步功能,软件提供灵活的定时机制(工作流内部定时或作业定时),时间粒度最小可以设为秒级,通过对同步ETL任务周期性的定时触发,达到对变化数据的实时同步。数据从抽取到装载采用原子事务操作,充分保证了数据的完整性。
文件同步
Beeload内置FTP文件传输功能,可以通过FTP传输功能同步远程机器文件夹到本地,也支持本地文件夹同步到远程机器。FTP传输文件采用多线程并发传输,支持文件的断点续传。
工作流调度
软件内置工作流建模工具和调度引擎,用户可自由定义任务的触发条件及执行路径,控制多任务的协同运行
1.支持多任务的并发运行,支持并发任务的同步完成;
2.支持成功、失败、条件等三种路径,支持基于全局变量的条件路径转移;
3.支持任务的定时(可基于日、周、月、工作日、时、分、秒等)触发;
4.支持系统命令、外部程序调用;
5.提供HTTP、FTP等文件传输功能;
6.提供邮件通知功能;
7.流程运行时的动态轨迹指示,向用户反馈子任务的执行状况;
WebService
Beeload可作为数据源向外发布数据,通过与Apache HTTP Server的结合,Beeload可作为WebService供用户调用,交互的数据采用SOAP封装,用户在IE中可直接访问软件发布的数据,用户也可以按照标准的WebService接口创建自己的客户端程序 获取数据。
用户可通过HTTP协议远程控制BeeDI中的任何作业,如远程启动或停止作业,远程查询作业状态。
脚本调试
在Beeload中,支持创建三类任务:ETL、工作流及Bee脚本,用户可以对每种任务进行调试。
1.支持ETL、工作流模板视图到脚本视图的快速切换,用户可直接了解任务执行细节;
2.在脚本视图中支持任务的断点运行,任务执行到断点所在脚本时暂停;
3.在脚本视图中支持逐行单步调试任务,任务每当执行完一行脚本后即进入暂停状态;
4.在任务处于断点暂停或结束状态时,可以对脚本中变量值的进行查看;
作业监控
Beeload采用作业调度策略控制任务的运行:
1.支持多个作业的并发运行,可以限制最大运行作业数;
2.支持作业排队机制,当已运行作业达到最大数时,后续启动作业进入排对等待状态;
3.支持作业的优先级设置,多个作业处于排队状态时,优先级高的作业首先进入运行状态;
4.支持作业的启动、暂停、恢复运行和停止等控制;
5.作业支持定时启动,提供多种定时策略,包括日、周、月、工作日、时、分、秒等,通过对作业定时启动可实现作业的循环自动运行;
6.直观的作业执行进度及状态显示;
联系人:宣向阳
联系电话:010-82176643
联系地址:北京市市辖区海淀区 北京市海淀区东北旺北京中关村软件园孵化器1号楼B座1322-5室