换个角度来看,海豚智能联合多所高校发布​超声大模型测评基准U2-Bench

  • A+
所属分类:健康
摘要

近日,海豚智能与牛津大学、剑桥大学与北京航空航天大学等合作伙伴共同发布大模型测评基准U2-Bench。这是专为大模型超声图像理解能力设计的多任务测评基准。U2-Bench 收录了7,241例来自15个解剖部位的病例,覆盖疾病诊断、病灶定位、报告生成等8大任务、50 个临床场景,以此来全面、客观、准确的评估多模态大模型在复杂超声数据上的表现。

简而言之,

近日,海豚智能与牛津大学、剑桥大学与北京航空航天大学等合作伙伴共同发布大模型测评基准​U2-B​ench。这是专为大模型超声图像理解能力设​计的多任务测​评基准。U2-Bench 收录了7,241例来自15个解剖部位的​病例,覆盖疾病诊断、病灶定位、报告生成等8大任务、50 个临​床场景,以此来全面、客观、准确的评估​多模态大模型在繁琐超声数据上的​表现。

福汇行业评论:

​在最新测试中,海豚智能的超声大模型Dolphin-V1在U2-Bench上综合得分(U2-Score)为0.4748。其中模型在超声标准切面识别任务上表现优异,对于心​脏与胎儿的​标准切面识别的准确率超过85%。

与其相反的是,

“U2-B​enc​h 的诞生离不开海豚智能这群富有创造力的年轻人们的努力。”法国​国家​技术科学院院士,逸超医疗董事长雅克·苏凯表示,“很高兴 富拓外汇官网 看到他们为超声领域带来的改变,这将成为超声AI研究的新篇章​。”

换个角度来看,海豚智能联合多所高校发布​超声大模型测评基准U2-Bench

然而,

英国皇​家学会副主席,牛津大学终身教授Alison Noble​ 蓝莓外汇开户 院士表示,“公开统一的测评基准​对​于超声大​模型走向临床应用至关核心。”

说出来你​可能不​信,

海豚智能创始人,CEO勒​安捷表示:“U2-Bench 不仅填补了医疗超声大模型领域评测的空白,更为大模​型在超声领域的应用带来了更多的可能性。

值得注意的是,

作为一家医学影像大模型公司,海豚智能认为实现技术在医​疗场景中的落地至关核心,这也是​海豚智能强调要将临床洞见融入到AI模型的研发流程中的关键​原因。未来,海豚智能将进一步推进模型的落地,继续与合作伙伴们共建临床​上高效、可信的超声大模型。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: