▲姑姑与付贵分别提交的寻亲照片。
“如果依赖过去的人工排查,这样的案例肯定就被错过了。再加之宝贝回家平台的数据库中,被拐儿童寻亲和父母寻找丢失的孩子是两个分开的系统,要靠人工去一一匹配,工作量不可想象。”上述工作人员说道。
澎湃新闻了解到,百度与宝贝回家平台的合作的主要内容,就是帮助宝贝回家设计和实现信息的集中管理,让所有线索汇聚起来,加上百度的跨年龄段人脸比对技术,帮助宝贝回家尽快找到高疑似案例,交给志愿者追踪和落地线索。百度接受项目后,先后邀请了IDL(深度学习实验室)、AIP(AI平台部)、AIQA(AI测试部)、众测(平台测试部)等多个部门的十几位技术人员加入,成立了“AI寻人”虚拟团队。
百度技术团队向澎湃新闻记者表示,此次宝贝回家照片筛选对比的难度远远比预估的要大。首先是数据量不小,宝贝回家提供的第一批数据,超过2万张,而且其中还有许多无效照片,如部分人员去世或失踪、无法追寻等。此外,还有照片不规范的情况,如照片经过美化、照片中人物过多、父母无孩子照片直接上传父母本人照片、比对年龄区间较大等,都给比对工作增加了难度。
识别年龄跨度可达30年
目前百度人脸识别人工智能系统能够识别的年龄跨度可达30年。
百度AI平台部产品经理杨抒含介绍称,人脸识别技术基本原理,是从人脸照片上,提取所有的面部特征(眉毛、眼睛、鼻子、脸型轮廓等),把这些特征换算成不同维度,并给每个维度配比上不同的权重。当两张照片进行对比时,会针对每个维度挨个对比,得出每个维度的相似度得分,再根据每个维度的权重比例计算出总体的匹配度得分,给出两张脸的相似程度。