企业数字化运营离不开对AI算法的使用,而使用AI的企业比例也在逐年上升。Gartner所发布的数据与分析领域十大技术趋势中提到,到2024年底,75%的企业机构将从试点AI转为AI运营,基于流数据的分析基础架构的数量将因此增加5倍。
许多大型企业在针对各个业务场景建立、训练及部署AI模型时,通常需要消耗几个月的时间,AI模型开发、调试及上线整体流程也较为繁琐,同时各个业务场景下所需的众多AI模型之间、AI模型与业务系统之间难以管理进而形成协同。
DataCanvas九章云极是一家数据科学自动化技术服务公司。其推出的标准化产品: DataCanvas数据科学平台,可以帮助企业在该平台上自动化地完成自身各类业务场景下AI模型的搭建和交付使用。该产品目前分为机器学习平台DataCanvas APS和实时决策中心RT两部分。
从实现环节上来看,DataCanvas APS提供从特征衍生、模型选择、超参数优化到模型评估,再到模型定期优化一系列建模全流程的自动化功能。同时,企业客户还可以通过平台上的模型仓库实现对模型的版本管理。
从底层架构上来看,DataCanvas APS运用了包含容器技术、微服务和Devops等在内的云原生技术。DataCanvas九章云极联合创始人兼董事长方磊向36氪表示,企业在云原生架构下可以更加灵活、方便地开发及部署落地AI模型。
首先,采用基于Docker的容器技术,将异构框架下的不同模型进行标准化的封装,并将模型与底层运行环境解耦之后,企业可以混合使用Python等常规数据分析程序和Tensorflow等多种机器学习框架,也可以自动化地对模型、计算任务及资源进行动态管理、部署及调用。
其次,在AI模型和企业业务系统微服务化基础上,发布后的模型将可以通过API调用,AI模型和业务系统间的交互使用更为便捷。
此外,公司十分注重平台的开放性,与有些公司提供“黑盒”算法库不同,DataCanvas APS上提供的是开箱即用“白盒”算法库。
具体来说,当企业AI能力不足时,企业可以直接使用平台内置的100多种算法模型,这些算法包括企业常用的统计分析、机器学习、深度学习算法,以及运筹优化算法。企业AI能力得到提升之后,依然可以在平台上开发属于其他框架的AI模型。
为了模型更好地应用于业务场景,公司还推出了实时决策中心RT这一款产品,该产品将业务规则和AI模型结合起来共同为企业提供决策支持。例如在工业场景下,采集MES、产线传感器等多个来源的数据之后,RT将依据AI模型的结果和具体业务规则对产线是否出现异常做出判断,辅助企业产线维护决策。
业务落地方面,公司目前主要集中于金融行业、通信行业、零售行业、制造行业、交通行业及政府等领域。营收方面,公司今年预计实现100%的增长。目前公司来自金融行业的收入占比超过50%,主要客户包括银行、保险、基金、证券、资管等金融机构。方磊表示由于金融行业过往数据沉淀积累的周期较长,围绕数据的基础设施也较完备,所以对机器学习平台的需求更为迫切。
方磊认为随着大量数据变得可采集,其他行业对形成AI能力的需求将呈现增长趋势。例如在高端制造领域,特别是在自动化程度更高的汽车、3C行业,随着物联网技术的应用,企业需要构建多种AI模型来对大量的非结构化工业数据进行分析处理。因此,DataCanvas九章云极未来也将在制造领域拓展客户,目前已经与海信集团进行合作,帮助海信集团搭建其工业互联网平台:信智AI平台,降低其建模时间和成本60%以上。
未来发展方面,公司将继续开发和建设其机器学习平台,提升产品的开放性和算力调度能力。
开放性方面,公司近期推出了两个开源框架,来更好地降低企业使用AI等数据科学技术的门槛。
其中一个为自搜索神经网络框架Hypernets,企业客户通过这种基于超架构的搜索空间,可以更快地完成神经网络超参数和微架构的自动搜索和模型训练,而以往企业模型开发人员需要花费大量时间阅读前沿论文才能寻找到最为合适的训练网络。另一个开源框架则会帮助企业将数据结构化,缩短模型训练的前期准备时间。
另一方面,DataCanvas九章云极还将提高平台的算力调度能力,帮助企业统一调度GPU、FPGA等多种硬件算力资源,提高算力资源利用率。
团队方面,方磊,弗吉尼亚理工大学博士,曾任微软Bing数据科学家,现任公司董事长;辛儿伦,前Teradata大中华首席执行官、前微软大中华副总裁,斯坦福大学电子计算机双硕士学位,并拥有29年信息化行业经验,现为团队新任总裁。
DataCanvas九章云极今年4月宣布完成1.2亿元C轮融资,投资方为中关村发展集团、广发乾和、达泰资本、襄禾资本、红点创投中国基金、中关村前沿基金、士达克资本。公司正在开启新一轮融资。