以“数据即服务”的理念,从上百个 异构系统抽取元数据汇总到大数据平台,经过数据清洗,治理,分类和建模处理后,按需将数据虚拟化。制定数据安全权限, 可与相关单位共享集团数据资源
睿晖的大数据解决方案是基于Spark 和 Pivotal Gemfire/Geode 内存计算技术(IMC - In Memory Computing)的HTAP架构(Hybrid Transactional Analytical Processing)。 Gartner預測,到2020年, IMC將被納入大多數主流数据平台中 。 IMC(内存计算)是HTAP的理想选择,因為它支持實時交易數據的實時分析和態勢感知,而不是依賴於對陳舊數據進行事後分析。通過內存計算,整個事務數據集已經在内存中,可以進行分析。 更複雜的內存計算平台可以將計算與數據共同定位(co-locate),以跨數據集群運行快速,分佈式分析,而不會影響事務處理,這意味著不再需要將操作數據集複製到OLAP系統。
使用IMC最大的优点是它將使企業能夠實施混合事務/分析處理(HTAP)的策略,這些策略可通過提供對大數據集的實時洞察,同時降低成本來徹底改變數據處理。
数据即服务(DaaS)和 混合业务数据架构(HTAP)
数据即服务(DaaS)的逻辑是指将数据集中化管理,可以是物理的集中或是逻辑的集中;将数据相关的任何服务都安排在一个集中化的位置,如数据聚合、数据清洗,数据质量管理等。将数据(例如,交易、产品以及客户数据)按需求将“数据虚拟化”,提供给特定的应用和用户,而不用考虑数据具体的存放位置或者不同的组织部门。
HTAP(Hybrid Transactional Analytical Processing )的架构是国外企业最新崛起的IT架构, 是一款同时支持 联机事务处理(OLTP)和 联机分析处理(OLAP)两种业务类型的分布式架构,支持分布式事务,在线弹性扩容,异地多活及自动故障恢复等功能。HTAP的优势是可以将 OLTP 和 OLAP 两种业务在同一份数据上进行,免去数据从运营数据库复制,落地,转换,加载到数据仓库的复杂流程, 极大的降低了数据存储成本,缩短了数据分析处理的延迟时间。另一方面分布式的并行处理将数据分析,推荐系统,报表等多种大数据和 OLAP 的场景与 OLTP 相结合,为实时的商业分析以及企业决策提供了支持