【甬派】寻找向“新”力|博登智能:为人工智能深度学习“划重点”

发布时间:2024-08-29 浏览次数:47

甬派客户端记者 金鹭

博登智能开发的系统支持覆盖市场上95%以上传感器驱动的数据,已经与吉利汽车、零跑汽车、中国联通等头部企业和多家大医院建立了稳定的合作关系。

甬派君有话说

新质生产力是我国在新一轮科技革命和产业变革中“变道超车”的根本动力。

作为宁波培育新质生产力主阵地和高质量发展主引擎,宁波高新区按照“又高又新”的战略要求,全面打造科技创新策源地、成果转化首选地、数字经济发展新高地、青年人才集聚地,争创世界一流高科技园区。

甬派推出“寻找向‘新’力”系列报道,讲述高新区高水平创新型人才和企业向“新”而行的故事。

自动驾驶数据标注场景。

打开电脑,开启人工智能数据处理平台,宁波博登智能科技有限公司的工作人员开始了一天的工作。

他们最近的任务,是为国内一车企处理一系列海外回传的数据,帮助其建立深度的自动驾驶模型。

“我们要做的工作是数据标注。用通俗的话来说,就是从海量数据中,为人工智能‘划重点、做标注’。随后,训练师就能将这些有用的信息‘投喂’给人工智能,对它们进行高效训练。”企业创始人赵捷向记者解释。

数据标注这一行业鲜为人知,却是支撑自动驾驶乃至整个人工智能产业发展的重要基石。如今,自动驾驶已成为数据标注最为重要的市场之一。

记者了解到,在教会系统识别车或者人之前,需先通过摄像头或雷达搜集环境信息,并通过人工对这些信息进行标注,之后反馈给人工智能进行训练——人工智能才会知道哪些是车,哪些是人。

整个过程中,数据标注师需要把人、车、道路等框选出来,通过大量道路数据反复让模型训练。

“尤其在一些复杂的场景,比如闯红灯的车辆、横穿马路的行人、路边违章停靠的车辆等的识别,更需要高质量、高精准度的数据。”赵捷说。

吉利汽车。资料图

不过在很长一段时间内,数据标注被普遍认为是一个利润率低、高度依赖人工的“苦力活”——数据标注师要阅读大量相关的文件文本,才能从中提炼和标注出关键信息。

随着自动驾驶向L3、L4推进,据英特尔推算:每辆车每天产生的数据量将高达4000GB。虽然市场潜力巨大,但高度依赖人工的标注模式,其花费的时间、金钱成本越来越高。

“传统的人工标注模式生产效率是有极限的,未来将无法满足需求。”2019年,在德国专注于人工智能领域十余年的赵捷,敏锐地发现了新的市场方向。

博登智能的解法是,将这一过程自动化。

“我们的算法能够自动识别和分类大量数据,减少人工干预的需要,从而大幅度降低了人力成本。同时,通过自主学习,我们的系统能够不断自我优化,提高标注的准确率,进一步减少因错误标注而产生的额外成本。”赵捷说。

相较于传统的标注方式,博登智能所提供的数据处理方案,能节省30%至40%的成本,并提升50%以上的效率。

基于AI数据自动处理系统,博登智能在创立之初就开发出全国领先的人工智能大数据中台和海量极速高精度图像搜索引擎。

流程示意图。

赵捷举了个例子,在1000万张人脸照片中,博登智能能够在3毫秒内找到特定目标。此外,博登智能还测试过8000万量级的人口库,结果显示,匹配到特定人脸的整个过程只需200毫秒。

除了自动驾驶领域,博登智能开发的系统支持覆盖市场上95%以上传感器驱动的数据,已经与吉利汽车、零跑汽车、中国联通等头部企业和多家大医院建立了稳定的合作关系。

赵捷对企业未来的发展充满信心:“目前,我们的业务已经成功拓展到欧洲市场,并计划在中东和美国设立分支机构。今年,企业开展技术创新和成本控制,力争在国际舞台上赢得更多的合作机会。”

编辑:傅婷婷 审核:张颖

热门政策