• 合作与生态
  • >   云合作
  • >   数梦工场合作
  • >   DThink大数据解决方案

数梦工场  ·  DThink大数据解决方案

DThink大数据系列产品是数梦工场针对大规模数据分析场景所设计的商用大数据产品,能
够提供TB/PB级别以上的数据分析处理能力及一站式的数据运营能力。

方案概述

DThink大数据系列产品是杭州数梦工场科技有限公司(以下简称数梦工场)针对大规模数据分析场景所设计的商用大数据融合解决方案,提供TB/PB级别以上的数据分析处理能力及一站式的数据运营能力。 数梦工场DThink大数据系列产品覆盖了从数据基础设施、数据中心到数据应用的所有维度,提供业界最全面的大数据解决方案。在数据基础设施层面,提供了业界最强的集群能力,最大单集群规模可扩展至10000个节点,并且支持多集群部署;在数据处理层面,提供了离线计算引擎、实时OLAP计算引擎与流式计算引擎,在离线计算引擎中包含了业界最全的机器学习算法库;在数据中心层面,实现了多租户数据管理与数据安全交换体系,对外开放完整的SDK及API,满足定制化需求;在数据应用层面,提供了数据开发工具、基础数据应用及业务数据应用,涵盖了数据采集、数据开发、数据挖掘、数据可视化到业务数据应用的全闭环数据处理流程。 数梦工场DThink大数据系列产品结合不同客户不同场景的大数据应用需求,提供DThink集群和DThink一体机两种交付形态。

数梦工场DThink大数据解决方案

优势特点

  • 数据安全

    在安全方面具有从存储、授权、交换、使用的全生命周期安全管理体系。为用户提供高达99.99999999%的数据可靠性及99.9%的服务可用性;支持精细化的数据权限管理,可对数据进行等级划分,并基于角色,字段,表进行灵活授权;支持多租户数据隔离,并通过数据管理者与系统管理者分离,去超级管理员等机制,实现租户数据的安全管理;支持生产环境与开发环境隔离,并通过机密数据自动脱敏,实现可用不可见数据开发模式;支持不同业务方在第三方仲裁下进行数据授权机制,实现机密数据的安全交换。

  • 数据采集

    DThink大数据产品在数据采集方面具有采集工具丰富、采集类型多样、采集方式灵活、采集性能强劲的特点。可针对不同的采集需求提供相应的采集工具与采集方式;可采集结构化、半结构化、非结构化数据,可提供全量或增量的数据采集方式。

  • 存储能力

    DThink大数据产品在数据存储方面具有大规模、高可靠、高性能的特点。单集群可支持10000个计算节点,通过分布式多集群部署,可实现无限扩展;提供高达99.9%的服务可用性与99.99999999%的数据可靠性;性能方面支持多线程、高并发、高吞吐量的数据上传下载,提供高速的数据写入与读取能力。

  • 计算性能

    DThink大数据产品在数据处理方面提供了离线计算引擎、实时分析引擎、流式计算引擎、机器学习引擎,支持批处理计算、实时数据计算、内存计算、图计算等多种计算方式,支持大部分SQL语句,并提供开放的API、SDK开发组件。

  • 应用组件

    DThink大数据产品在数据应用方面提供了丰富的应用组件,涵盖了数据的交换、存放、建模、开发、分析、展现、管理、共享等多个方面,赋予用户快速便捷的创建、维护大数据应用的能力。

  • 专业服务

    数梦工场致力于为客户提供及时全面的客户服务,从项目设计、开发、部署、培训、运维等各个阶段提供专业的服务,确保客户的系统与应用运转无忧,确保客户可以轻松、高效地运用大数据技术,为自己的企业带来新的增长动力。

典型方案

  • 电网业务增值
  • 反互联网商业欺诈
行业背景

电网业务结构几十年未变,单一的业务结构难以提高服务竞争力,也难以塑造竞争壁垒,而传统的商业模式又无法支撑企业业务的创新与发展。电网客户迫切希望通过大数据分析,实现从单一服务模式向综合服务平台进行转型。通过充分挖掘个人消费者的生活服务需求与行业客户的商业需求,引入各项全新业务及商业模式,为未来新的利润增长点打下基础。

客户价值

DThink大数据产品首先会根据电网客户组织架构,构建与之相匹配的数据开发及数据管理模式,如与现有业务系统账号体系对接,继承现有账号体系权限设计,并根据客户组织架构,建立适合客户的数据安全体系;其次通过对用户现有系统进行分析,为用户提供一整套数据迁移方案,快速实现对生产数据的采集;最后,根据用户的业务需求,为用户设计最贴切的数据服务,包括数据开发服务、数据共享及交换服务、为支撑上层业务系统而提供统一数据出口等服务。
电网客户目前拥有海量的用电、传输调度及发电数据。仅针对于用电数据,即可挖掘出面向家庭、企业、政府的各项增值服务。DThink大数据产品通过DXT快速实现对生产数据的采集。客户的数据开发工程师可通过数据地图快速找到自己关心的数据、通过数据挖掘工具、报表及数据可视化工具洞察数据潜在价值、通过IDE(集成开发环境)进行数据建模开发。数据模型建立后,可快速部署到生产环境,ODPS(大规模离线计算引擎)可实现万亿级别数据的快速计算,给出处理结果,从而实现对上层业务系统的数据支撑。

行业背景

互联网营销及电子商务的兴起对传统管理方法及业务系统带来了新的挑战。管理部门需要转被动为主动,通过公众大数据分析与预测,来进行市场监管,防范于未然。

客户价值

管理部门通过爬虫对重点网站数据进行抓取,通过对互联网平台进行SDK植入获取平台数据,通过运营商分光数据获得用户访问数据,DThink大数据产品使用DXT将管理部门获取到的公众数据及内部业务系统数据采集到大数据平台。利用ODPS(大规模离线计算引擎)实现海量数据的去重、降维及分类,挖掘出虚假企业、经营范围违规等信息,实现企业网上行为的监测;通过ADS(实时OLAP计算引擎)实现实时数据分析,如重点商品的舆论跟踪;通过文字、图片及视频分析,提供违规广告识别的能力等。

常见问题
  • Q:数梦工场与阿里巴巴的关系?
    A:数梦工场是阿里巴巴参与投资的公司,基于阿里,专注政企,行业化提供大数据云计算平台及服务。
  • Q:数梦工场的使命是什么?
    A:数梦工场的使命是把互联网的实践成果转化为各行各业创新的基础设施和实现工具,使其业务质量及效率得到巨大提升,实现互联网时代的业务变革。
联系我们
  • 腾讯微信:dtdream_corp
  • 新浪微博: 数梦工场科技有限公司
  • 公司总机:0571-58110888
  • 公司传真:0571-56150700
  • 公司地址:杭州市西湖区云栖小镇山景路中大银座9栋

数梦工场微信公众平台