更多精彩,请点击上方蓝字关注我们!
TigerGraph创始人兼CEO许昱博士
图数据库是一个完全不同于关系型数据库的新型数据库,它是为处理大规模数据和分析深度关联关系而生的。数据库咨询公司DB Engines的数据显示,图数据库是当前所有数据库管理系统中增长最快的一类。有业内人士指出,图数据库市场的增速至少是传统关系型数据库的十倍以上。
其实,早在15年前就已经了图数据库技术,但为什么没有形成大规模应用呢?因为没有基于多核、并行计算的强大计算力,因为没有大数据,因为每深入分析一层,需要处理的数据量就呈指数级增长,而在当时的条件下,没有一个有效的工具能够突破上述瓶颈。
“现在是一个非常好的时机,因为数据呈爆炸性的增长,单纯依靠硬件堆叠无法突破处理性能的瓶颈,市场和用户都呼吁新一代的企业级实时图数据库平台。”TigerGraph创始人兼CEO许昱博士指出,“图数据库是一个非常巨大的市场,历史上因为种种原因限制了它的发展和普及,现在美国很多行业的头部企业越来越关注这一新市场。”
为了快速推动图数据库应用的落地,现阶段最重要的工作就是让更多的人深度认知图数据库的概念,了解图数据库到底能做什么,能为企业带来怎样的价值。
有人说,2018年是图数据库应用的元年。好消息是,IBM、AWS等业内巨头已经开始在图数据库上发力,这有利于图数据库概念的传播,将市场蛋糕做大。而像TigerGraph这样聚焦在图数据库领域的成长型企业正好可以顺势而为,充分发挥自身产品所具有的高性能、平台化和开放性、灵活匹配不同行业需求的优势,在全球范围内掀起一般图数据库应用的新热潮。
超越传统关系型数据库
大千世界,人海茫茫,有时擦身而过的两个“陌生人”之间可能也会有着千丝万缕的联系。1967年,哈佛大学心理学教授Stanley Milgram创立了“六度分隔理论”,简单说,最多通过6个人,你就可以认识任何一个陌生人。
无论是在工作还是生活中,我们很多时候做的就是寻找两个不同的点、两个不同的人或两件不同的事之间的联系。以前,我们若想找出两个任意点之间的关系,通常要借助给定的路径,如果没有明确的路径,找到两个点之间的联系似乎是不可能的。但是图数据库就有这样的能力,它能以秒级的速度准确地找到两个从表面上看似乎没有任何关系的事物之间的关系。
TigerGraph中国区总经理乌明捷提到这样一个案例,有机构曾找到TigerGraph,希望他们根据仅有的30个人的ID信息,查出这30个人之间有什么样的关系,以及在这一群人中谁是那个最关键的人物。这样一个看似无解的问题,最后通过TigerGraph的努力得到了完美解决。
其实,图数据库当前应用最多的领域还是金融,比如亲密度分析,银行信用卡中心为了找到失联持卡人,为所有持卡人建立亲密度关系模型,并依据此模型评分找到和失联持卡人关系最亲密的持卡人;再比如反洗钱,基于图数据库,通过反查算法,从可疑转账记录出发,往上游和下游两个方面进行探索,就可以发现资金来源账户和资金目的账户。
乌明捷表示,传统的数据分析方法先要收集数据,然后经过一晚上的计算,可能第二天才能得到反馈。但是采用TigerGraph的解决方案可以实时得到想要的结果。
2017年,TigerGraph新一代企业级实时图数据库平台正式在美国发布时便引起不小的震动,许多金融客户,以及保险、电信、房地产公司等纷纷找上门来。“以前,人们接到一个陌生的电话,判定它是诈骗电话通常要通过人工打标签的方式,而且往往是‘事后诸葛亮’。现在,采用实时图计算+机器学习系统,就可以实时判定来电是否存在诈骗行为。”许昱表示,“看似没有任何关系的两个事物,都可以通过‘图’来找到它们的之间的必然联系,这超越了传统关系型数据库的能力。”
探寻真理,就是要抽丝剥茧,透过现象看本质。但是,如何才能一层一层剥开外面的“伪装”,找到隐藏在深处的关联呢?一步两步,还是要五步十步?图数据库最擅长的就是深度关联分析。
许昱告诉记者,图数据库与传统关系型数据库的存储模型不一样,数据压缩率是关系型数据库的数倍,图数据库才是真正针对关系的数据库,而不是像关系型数据库那样人为地将数据打散。在图数据库中,点和边的关系其实是数据最自然的存在状态,因此更适合进行大数据分析。
现在,高性能的计算设备有了,数据量也足够大,如果还沿用那些传统的计算模型和工具,是不可能跟上人工智能时代发展的脚步的。只有建立基于图的分析系统,才能找到隐藏在数据背后的关联,更好地挖掘数据的价值,实现商业价值最大化。
图数据库市场的下山猛虎
直到2017年新一代企业级实时图数据库平台发布,以及获得3100万美元A轮融资,TigerGraph才真正露出了峥嵘。从严格意义上讲,TigerGraph并不是一家新公司,不过从2012年至2017年,它一直在埋头研发,鲜有市场动作。
让许昱备感自豪的是,TigerGraph是截至目前全球唯一一家提供企业级原生并行图数据库、图数据库云服务的厂商,其原生并行图技术为拥有复杂而庞大数据的企业提供了实时深度链接分析能力。所谓原生,简单说就是什么都自己来,计算引擎、分布式存储、查询语言等全是TigerGraph的研发人员一手创造的。许昱坦言,五年来,公司在研发上踩过太多“坑”,总结起来在以下两方面做得最成功:第一,从头开始,而不是基于Hadoop、其他分布式存储关键值数据库等,建立最优化的体系结构;第二,选择C++作为编程语言,GSQL作为查询语言,既保证了专业高效,又简单易用。
在2012年至2017年的5年间,TigerGraph的团队真的是关起门来做研发,因为要实现海量数据的深入探查确实有大量技术难关要克服实在太难了,但最终还是挺了过来。“在开发新一代企业级实时图数据库平台的过程中,我们充分发挥了工匠精神。” 回忆起这段开发的历程,许昱至今十分感慨。
2018年初,TigerGraph正式进军中国市场,仅仅三个季度,已经有了很多中国企业客户,覆盖电信、金融、电力 、电子商务、物联网等多个行业。据说TigerGraph在国内一露面,就有很多投资人主动找上门来,但TigerGraph并不于融资,还是想先打好基础。
许昱表示,公司刚刚开始在全球进行市场推广,目前的业务重心还是在欧美市场,在中国主要是通过系统集成商等合作伙伴进行销售,并树立样板客户,从金融行业开始慢慢向多个行业渗透。
TigerGraph目前既提供免费的单机版本,也提供收费的企业版本。虽然TigerGraph的产品本身不开源,但可以无缝地与其他图数据库或关系型数据库对接,当然也支持开源的数据库,可以更好地满足一些中国用户的需求。TigerGraph的平台提供API,合作伙伴可以在其上进行二次开发。“我们不应用,也不卖数据。”许昱表示,“在中国,我们的战略是推动生态的建设,依靠合作伙伴发展。我们会在一定程度上满足中国用户对定制化开发的需求。”
TigerGraph的出现可以说是在传统关系型数据库占据主流的市场上打开了一个缺口。不过,许昱澄清,TigerGraph并不是上来就要替代传统关系型数据库。颠覆或者与传统大型数据库厂商正面竞争,TigerGraph是从新市场、新业务切入,主要面向那些需要复杂计算和深度分析的场景,而这些正好是传统关系数据库力所不能及的。从应用的角度说,TigerGraph也是在摸着石头过河,比如有些用户一开始购买TigerGraph的产品只是用于金融反欺诈,但后来慢慢地将越来越多的应用迁移到TigerGraph的平台上,应用的广度和深度逐渐加强。TigerGraph并不是要替代别人,而是要在深度关联和实时计算方向做客户唯一的选择。
虽然现在也有一些大厂商关注到了图数据库市场,但是船大难掉头,同时考虑到既有商业利益,这些大厂商目前还没有在图数据库方面投入过多力量。许昱并不担心有朝一日那些大企业会追赶上来,因为TigerGraph的创新速度非常快,反而是比较关注初创的企业,是不是有更新的技术推出。“图数据库是TigerGraph的生命。我们必须保持专注和持续的创新。”许昱表示,接下来,TigerGraph计划率先在美国推出图数据库云服务,同样也是面向企业级客户。
从公司的名字TigerGraph,就可以看出许昱和他的团队的抱负和气魄。TigerGraph就是图数据库市场的“下山猛虎”。图数据库市场猛于虎?我们有了更多期待。
长按二维码识别关注云报
中国云报
小编微信:Taogebj
联系邮箱:[email protected]
继续阅读
阅读原文