浦东新区人工智能公共技术服务平台

百度飞桨(张江)人工智能产业赋能中心

|

数据集

大规模高质量成品训练数据集,助力高效构建、训练和部署机器学习模型

【医疗】医疗数据语料资源2025-09-05

可交易医疗数据集资源,数据量为 26,188,067。

百行云游

垂类大模型语料-医疗

该大模型垂类语料围绕医疗领域构建,按层级分类,一级目录为医学标准术语,之下细分多个二级和三级目录。

在医学标准术语的疾病二级目录下,有症状知识表、ICD2.0 诊断层级表、标准科室列表、常见病列表等丰富内容。其中症状知识表数量为 6877,ICD2.0 诊断层级表数量多达 34709,常见病列表有 759 条。

这些数据能够为医疗相关大模型训练提供全面、专业的信息支撑,助力模型在疾病诊断、症状分析、科室匹配等方面的学习与应用。

详细数据结构请通过下列表格获取样例结构。

如需获取数据样例请发送邮件标题:【数据样例】垂类大模型语料-医疗清单至: zhouchenyue@baidu.com