DataZoo 是荣之联以开源Apache Hadoop 为基础, 结合行业特性构建的大数据平台产品。为企业发掘数据价值、辅助业务决策、加速数据应用落地提供可靠支撑。基于DataZoo 荣之联提供端到端的大数据解决方案,已应用于公安、证券、电商、新媒体、车联网及生物医疗等多个行业。
1. 数据挖掘
分布式数据挖掘平台,提供分布式的模型算法。为数据科学家提供熟悉的工作方式,直接在熟悉的R 语言工作台编写分析程序,在分布式内存引擎上执行,与平台其他组件相互配合完成数据分析任务。DataZoo 积累了丰富的行业模型,尤其是在自然语言处理方面有大量的自主知识产权。
2. 实时流处理
DataZoo 实时流处理支持高度灵活的流式窗口,基于内存计算引擎保证数据分析的时效性。 接收实时数据,根据自定义时间间隔拆分为微批数据,处理后得到结果数据。稳定性经过大量测试,可以保证持续不断的7*24 小时的计算。
3. 数据仓库
DataZoo 数据仓库建立在Hadoop 之上,底层存储是HDFS 分布式文件系统, 提供完整的SQL 支持,用户直接通过SQL 语言查询数据。支持海量数据,具有高扩展性(存储和计算两个方面),可以运行在多种计算框架之上。
4. 多维搜索
DataZoo 多维搜索引擎是一个基于 Hadoop 分布式架构下的实时的、多维的、交互式的查询、统计、分析引擎,具有万亿数据规模下的秒级性能表现,并具备企业级的稳定可靠表现。DataZoo 多维搜索引擎是一个细粒度的索引,精确粒度的索引。数据即时导入,索引即时生成,通过索引高效定位到相关数据。DataZoo 多维搜索引擎与 Spark 深度集成, Spark 对检索结果集直接分析计算,同样场景让 Spark 性能加快百倍。
5. 工具套件
可视化平台管理工具
用户可以很轻松地查看服务状态、处理告警、监控集群资源;统一管理各个服务的运行参数,用户无需到各个节点上进行修改,可直接通过界面进行统一操作。
可视化数据采集工具用户可通过图形化界面的拖拽操作,高效地进行数据抽取、清洗、转换、过滤等操作。
可视化数据分析工具
可视化建模工具, 支持传统的报表和图表功能、自助分析、地理位置分析、What-If 分析和社交网络分析等。
联系人:王东辉
联系电话:010-62602000
联系地址:北京市市辖区海淀区 北京市海淀区北四环西路56号10层1002-1