研发背景

日本投入10亿研发的AI工具误判率高达60%!为何如此失败?  第1张

AI在全球范围内正快速进步,其应用范围持续扩大。为维护儿童权益,日本政府决定顺应科技发展趋势,拨付约10亿日元,约合人民币4879万元的研究资金。日本儿童家庭厅负责研发用于判断儿童是否遭受虐待的AI工具,旨在支持各地儿童咨询所的工作。

日本投入10亿研发的AI工具误判率高达60%!为何如此失败?  第2张

日本境内儿童虐待事件频发,儿童咨询所的工作人员在评估疑似受虐儿童是否需要临时保护时面临较大挑战。为此,该人工智能工具的研发旨在提出新的解决方案,这标志着日本在利用科技手段保护儿童权益方面的一次尝试。

设计初衷

日本投入10亿研发的AI工具误判率高达60%!为何如此失败?  第3张

该AI工具旨在有效协助儿童咨询机构员工执行任务。设计要求员工需录入包括孩子受伤情况、受伤位置、监护人态度等在内的91项信息,涉及多维度细节。

随后,AI将采用百分制对儿童遭受虐待的风险进行评估,分数数值越高,表明儿童可能遭受虐待的概率越高。这一做法旨在利用AI强大的数据分析功能,以更为科学和精确的方式识别儿童受虐情况,进而提升对受虐儿童的救助和保护效果。

测试困境

日本投入10亿研发的AI工具误判率高达60%!为何如此失败?  第4张

实际情况颇为严峻,该计划在测试环节面临重大挑战。该人工智能系统错误识别率竟达六成,这一数据令人震惊。

日本投入10亿研发的AI工具误判率高达60%!为何如此失败?  第5张

样本案例仅有5000例,数量显然不够。在100个测试案例中,有62个案例评分显著偏低。这一现象说明,基于现有样本,AI难以准确评估儿童受虐情况,无法满足实际应用需求。

具体案例

日本投入10亿研发的AI工具误判率高达60%!为何如此失败?  第6张

具体案例进一步突显了该人工智能工具的荒谬性。在某一案例中,孩子明确表示自己“被母亲重击至半死不活”“被抓住衣服后用头部撞击床面”,这些描述清晰地揭示了孩子遭受了严重的身体虐待。

AI工具的评分结果仅为2至3分。工作人员经过分析,指出这可能是由于输入信息中包含“孩子身上无淤青”的内容,导致AI产生了重大误判。这种误判可能导致真正遭受虐待的儿童无法获得及时的救助和保护。

功能缺陷

日本投入10亿研发的AI工具误判率高达60%!为何如此失败?  第7张

该AI工具存在多项不足,除了样本和误判问题,还未能充分关注“儿童体重减轻”等关键信息。儿童体重异常下降可能正是遭受虐待的显著标志。

日本投入10亿研发的AI工具误判率高达60%!为何如此失败?  第8张

此外,这91个项目仅记录了儿童是否出现某种现象,并未触及伤害的严重性和波及范围。因此,AI获取的数据非常局限,不能全面、细致地掌握儿童遭受虐待的真实情况,这进而降低了其判断的精确度。

项目搁置

日本投入10亿研发的AI工具误判率高达60%!为何如此失败?  第9张

日本投入10亿研发的AI工具误判率高达60%!为何如此失败?  第10张

考虑到前述的高错误率及众多缺陷,日本儿童家庭厅不得不暂时停止该项目的研发。他们明确指出,目前将此项目用于儿童咨询服务还为时过早。

日本投入10亿研发的AI工具误判率高达60%!为何如此失败?  第11张

遗憾虽在,此举措亦显理性,儿童权益之保障至关重要。众多问题尚存的AI工具不宜投入使用。日本可能需对项目重新规划与优化。