作者:李东耳

数据对于人工智能的推动作用不可忽视。机器学习、深度学习等算法在数据上的应用,使得AI能够从海量数据中提取有用的信息,并不断优化自身的模型和算法。如今大模型的爆发正是AI在数据的不断驱动下产生质变的结果。

随着越来越多的国产大模型亮相并开始投入使用,AI大爆发的时代已经不远,数据这一新型生产要素在未来生产实践中的地位越来越突出,越来越多的企业开始重视数据驱动的作用。

在即将进入AI大爆发的情况下,奇点云作为一家提供数据云产品的独立第三方数据基础设施厂商,自然也迎来了机会。据奇点云创始人行在介绍,从金额上看,奇点云的复购率已经超过了100%。

图注:奇点云创始人行在

近日,行在再次接受了首席消费官的专访,分享了其对于AI爆发的背景下,数据科技厂商所面临的新机遇新挑战,奇点云如何更好地为客户提供数据基建产品及服务,以及在服务客户中发现了怎样的新变化。

5月底发布的《人工智能大模型地图》显示,国内已经有79个大模型发布,AI已经开始在更多领域得到正式运用,在这样的环境下数据服务商所面临的环境发生了怎样的变化?对此,首席消费官对话奇点云行在,就AI环境进行了系统梳理。

首席消费官:您如何看待中国的AI环境,数据科技厂商面临的市场环境与过去有何不同?

行在:我觉得这需要从两方面看。奇点云始终关注AI,因此长期来看对我们没有什么变化,但短期来说,AI大爆发就意味着数据大爆发,因为数据是AI的基础,这两个是不可分割的东西。所以第一方面奇点云要在AI大爆发的过程中做好自己的事,支撑客户搭建好他们自己的数据基础设施,第二方面是奇点云要加速AI在整个产品和技术里面的融入,也就是AI for DB。

结构化的数据、交易类的数据价值是非常高的,这个在过去已经得到充分的挖掘,但实际上,很多非交易类数据、过程的数据也是非常有价值的,只不过价值密度没那么大,以前可以挖掘的工具也没那么多。今天,随着AI工具的完善,我们可以对这些数据进行更好的挖掘。

首席消费官:面对AI爆发的环境,奇点云做了哪些准备去更好地服务客户,帮客户挖掘更多价值?

行在:我们的应对并不是在大模型火了之后,而很早就认识到数据是AI的基础。奇点云在前不久刚获得了中国计算机学会主办、有300多支团队参加的CCF BDCI数字安全公开赛(其中一个赛题的)冠军。在2019年的时候,奇点云就确定了“AI驱动”战略,那时候的slogan就是“AI驱动的数据中台”。数据对一家公司很重要,积累了数据,它的AI才能得到更好的训练和使用。

奇点云在数据安全、数据运维等产品里都用到了AI,比如敏感身份的智能识别就是用深度学习做的,智能运维也是利用AI通过算法去发现运维当中有哪些问题并预警。我们有一个很棒的AI团队,所以可以将AI应用到不同的应用环境里。另外,奇点云也在探索大模型技术,把大模型技术应用到自己的研发中。

另一块是平台for AI。我们的平台并不仅仅是给数据开发工程师使用,也给算法工程师使用,我们内部叫“一库多用”。这么做的原因是以前在大厂的时候发现,算法工程师工作的时候必须把数据拖到自己的服务器之上。这就导致两个问题,一是数据从数据服务器跑到算法服务器上后,安全得不到保障,二是数据需要多储存一份,存储和计算的成本在上升。通过“一库多用”,两类工程师可以共同使用同一套平台、同一套存储,这使得我们的平台也可以被客户用来开发深度学习的算法。

首席消费官:AI爆发的背景下,企业对于数据安全的要求更高,奇点云如何确保客户的数据安全?

行在:安全是我们的底线,也是我们的生命线。我们不为客户提供数据,也从来不碰客户的数据。我们提供的是数据技术产品和服务,保证客户的数据安全是我们的生命线。奇点云有一个数据安全产品DataBlack,研发DataBlack的原因就在于,我们为客户搭建的数据云就相当于一个数据的“仓库”,DataBlack就相当于给这个“仓库”装了一个很高级的“防盗门”,能保证数据生产、流通、分析、存储全链路安全。目前,DataBlack已经具备全域的数据安全能力,除了保障数据云,也能支撑分析云的安全合规。此外,还有针对多租户等特定场景的安全策略和技术架构。

首席消费官:在越来越多的大模型应用到实际生产之后,奇点云作为第三方数据科技厂商的价值体现在哪里?

行在:第一,数据是AI的基础,通过数据基础设施(也就是数据云),我们能帮助客户更好地治理、管理、加工他的数据,这对于客户使用AI会更加方便。

第二,我们也在探索将行业模型引入到数据云平台上来,那么以后客户就可以一站式地去应用数据智能。这是两个比较显性的优势。

第三,是跨云多域,也就是“云中立”的优势。客户希望对IaaS有选择权,哪个便宜好用用哪个。作为独立第三方,我们实际上可以成为一个云上之云(横跨多个IaaS的PaaS),帮助客户实现数据基础设施的跨云。

我们数据云平台有一个独特的专利,就叫跨云多域。它相当于说我们帮客户建一栋大楼,帮客户存放数据,但这个大楼可以被分割成多个房间,每个房间架构在不同的云厂商上。这样的话客户不会被具体的云厂商“绑死”。如果因为各种原因,客户想要把数据从一家IaaS搬运到另一家IaaS上,搬迁起来也比较方便。同时出于安全稳定的考虑,跨云多域使得不同房间之间还可以起到备份的作用,如果一家云厂商突然宕机,通过奇点云的数据云平台,客户的数据安全和使用也不受影响。

首席消费官:随着越来越多公司开始重视数据团队建设,未来是否有可能将一些事情交给企业自己的技术团队去做?

行在:将一些行业的东西交给客户技术团队自己去做是一个很好的想法,目前来说,DT工程师还没有充分进入到甲方的IT部门,但这一点很快也在改善。一个有代表性的发现就是已越来越多的企业开始设立、重视CDO首席数据官这个职务。

美国的企业越来越重视数据驱动,所以越来越多的企业设立CDO。有一个调查显示,2012年的时候美国设立CDO的公司占比大概是在12%,到了2021年占比就突破了65%。中国目前虽然只有大概5%的头部企业设立了数据团队,但相对于以前1%都不到也是在快速变化的,我觉得未来3-5年可能会突破到20%。

当客户中越来越多的人懂DT的时候,我们就可以慢慢地把很多事情交给客户去做。其实当前也有很多客户把自己的数据团队和奇点云的数据团队成立一个联合项目组,我们在项目组中相当于是一个教练的角色。还有很多客户购买我们的培训服务,现在已经可以很好地使用奇点云的底层数据云平台了。

作者 Wang