12月4日,人工智能数据服务公司Graviti「中文名称:格物钛(上海)智能科技有限公司」宣布获得千万美元级Pre-A轮融资,资方为红杉中国种子基金、云启资本、真格基金以及风和资本。
Graviti成立于2019年初,聚焦于人工智能数据服务平台业务,致力于成长为非结构化数据集存储、加工、使用的一站式AI数据服务平台。目前,公司已经建立了人工智能行业所需的数据集管理和标注系统,为行业提供平台式服务。
公司创始人崔运凯认为,就人工智能三要素(算法、数据、算力)而言,数据的通用性介于算力和算法之间——虽然有计算机视觉、语音等不同种类的划分,但同类数据具有相通性,能满足不同企业的相似需求。
换句话来讲,Graviti瞄准了人工智能的计算机视觉领域,为该领域企业提供基础设施,其希望通过提供高效管理和输出高质量数据服务,加速数据在供需方之间的流通,以帮助企业发展。
毕业于上海交通大学和美国宾夕法尼亚大学的崔运凯,曾在自动驾驶行业“打拼”多年。此前,他曾任Uber无人驾驶部门的Tech Lead Manager,为该部门最早期一批员工。
作为自动驾驶行业的“老兵”,他深知数据质量对行业发展的重要性,因此,自动驾驶被选做公司业务的第一个切入点。
自动驾驶技术在落地过程中,需要依赖积累的大量真实道路场景进行模型训练,完成场景测试,一旦数据质量不合格,就会浪费大量时间,增加训练模型成本。而非结构化数据只有通过对相应特征进行提取标注后,才能直接用于模型训练。
这对标注公司的交付能力和数据处理系统提出了较高要求。今年以前,众多自动驾驶公司和其他有图像算法需求的企业正在通过自建标注平台、寻找外部人力等方式,试图解决日常标注需求,但其常常受到外包团队标注质量不稳定、需求排队等问题的困扰。
与此同时,在资本遇冷的当下,企业往往将更多资金投入主营业务中,对自身标注业务有所忽略,数据标注公司的价值由此显现。
但想要成为一家合格的数据标注公司,一方面需要开发性能良好的工具,输出满足机器学习模型要求的结果,另一方面还要科学运营人力,确保高效产出的同时节约成本。
为此,Graviti自主研发了标注平台。该平台一方面可以通过可视化系统展示数据内容,为工作人员呈现简洁易懂的后台操作页面,通过总结分析提升工作效率;另一方面则瞄准薪资平均水平较低的三四线城市的人力市场,能够在全国范围内动态分发和管理项目,通过多层质检、任务自动分发、数据分批交付的流程设计保证项目的完成效率。
据《2019-2020中国人工智能计算力发展评估报告》,预计2023年,中国人工智能基础架构市场将超过80亿美元。具体到数据标注领域,崔运凯估计,2018年国内市场规模在50亿元到100亿元之间。但就今年的市场情况来看,“每家公司都愿意或开始考虑寻找靠谱的合作伙伴,并为此项服务付费。”崔运凯表示。
毫无疑问,数据标注的市场规模正在不断扩大。该赛道的明星公司Scale去年的销售额在千万美元级别,今年已增长至近亿美元。今年8月,这家刚满三岁、诞生于美国硅谷的公司还宣布完成了1亿美元的C轮融资,发展势头良好。但由于涉及国家数据,Scale CEO Alexandr Wang已经明确表示会放弃中国市场。
这给了国内企业一定的市场机会。目前来看,国内数据标注企业多成立于2015年,由于大多数公司没有AI背景,因此服务质量普遍不高。
“服务好所有AI企业”遂即成为Graviti的目标。对于目前的Graviti而言,自动驾驶是其市场切入点,但不是终点。未来,该公司还希望与高精地图、人脸识别、机器人、智慧城市、智能安防、智能零售等领域客户展开合作,推动人工智能应用在更多场景落地。
崔运凯预计,国内数据标注市场将在未来两至三年内成熟。而Graviti的目标,则是在三年内成为行业的重要参与者。
提供标准数据服务外,Graviti也在有针对性地为客户提供咨询服务,帮助客户准备相关价值的数据集和训练模型,并将训练好的模型封装成相应的服务——这同时也是Graviti未来产品布局的重要组成部分。
目前,Graviti拥有来自哈佛、UT Austin、密歇根大学、上海交大、复旦、同济等高校的多位员工,公司正努力在自动驾驶和其他领域扩张合作场景,努力提升服务质量形成正向循环。