近期,国内知名医疗评估机构MedBench发布了最新排名。该榜单一经发布,便引发了业界的广泛关注。榜单内容表明,蚂蚁集团旗下的AI健康团队研发的蚂蚁医疗模型在评测和自测两项测试中均取得了优异的成绩,分别以97.5和98.2的高分领先,一举夺得了两项冠军,彰显了其卓越的性能。
再夺榜首佳绩
MedBench榜单最近进行了更新,蚂蚁医疗的大模型在其中表现突出。该模型在多个测评项目中均获得高分,尤其在医学知识问答、医学语言生成和复杂医学推理等方面,均位列第一。在此之前,该模型已连续多年在综合榜上占据首位,其能力持续受到认可,为医疗人工智能领域树立了新的标准。
测评标准重要
医疗行业面临诸多变化,因此建立一套高效、即时的评估机制对于医疗大型模型的应用和普及极为关键。MedBench平台为中文医疗大型语言模型设定了公正、公开、科学的评估准则。蚂蚁医疗大型模型在技术竞赛中表现出色,这充分展示了其在医疗人工智能产品开发领域的专业能力和技术优势,进而对整个行业的进步产生了积极影响。
引擎升级优势
近期,蚂蚁医疗健康团队发布了一款基于强化学习的新医疗推理模型。该模型经过技术升级,为AI引擎赋予了医学推理的能力。同时,模型能够处理图像、文本、音视频等多种模态数据,实现数据间的交互。通过扩充医学语料和知识图谱的训练,该模型的专业性能得到了明显增强。
图像识别成效
蚂蚁医疗的图像识别模型在医学影像、药物成分、发丝等领域表现出色,准确率超过90%。该模型基于多任务学习和强化训练技术,对医学图像进行精确分析,为医疗诊断提供了迅速且精确的辅助信息,有效提升了诊断的速度和精确度。
安全保障措施
蚂蚁集团研发的医疗级大型模型整合了其在隐私保护及风险管控领域的专业技术,并严格遵循去标识化数据应用的安全隐私规范。自去年7月推出后,该模型已向市场提供“可信一体机+可信云”的解决方案,该方案致力于确保数据隐私和计算效率,同时为医疗机构提供本地部署及数据保护服务。
广泛应用成果
自十年前成立至今,蚂蚁医疗健康公司已涉足医疗人工智能领域。公司在技术研发上取得了显著进步,AI应用发展势头迅猛。浙江省卫生健康委员会与该公司合作推出了“安诊儿”服务,该服务已服务约3000万人次。同时,公司还与多个地区开展合作,成功研发了近百个医生智能体。收购完成后,公司陆续发布了多款新品。因此,它已成为业内应用广泛、合作层级较高的垂直市场中的主要大型模型之一。
未来,蚂蚁医疗的大模型有望在哪些医疗子领域中实现更广泛的深入应用?这些领域可能包括但不限于哪些方面?