产品概述
华智云翳大模型是面向中医药领域的行业大语言模型,基于海量中医典籍、临床医案、现代研究文献与真实诊疗数据进行预训练与指令微调,覆盖诊断推理、处方生成、随访管理、知识问答等核心场景。模型支持私有化部署与API开放,融合专家知识蒸馏、术语规范增强与多模态扩展能力,为中医智能化提供可解释、可信赖的AI底座。
核心优势
- 行业预训练:基于100万+中医典籍、50万+临床医案、30万+研究文献进行预训练,深度理解中医术语、证候逻辑与诊疗思维。
- 指令微调优化:针对辨证、诊断、开方、随访等场景进行指令微调(Instruction Tuning),提升任务准确性与输出规范性。
- 专家知识蒸馏:将名医经验与临床指南蒸馏为模型参数,实现隐性知识显性化。
- 术语规范增强:内置中医临床术语系统(TCMLS)、ICD-11中医证候编码,确保输出标准化。
- 可解释推理:基于知识图谱与注意力机制可视化推理路径,医生可追溯AI决策依据。
- 多模态扩展:支持语音、气体、图像等多模态输入,融合四诊信息进行综合推理。
- 私有化部署:支持本地化推理与离线部署,保护数据隐私与安全。
- API能力开放:提供RESTful API与SDK,赋能合作伙伴快速构建上层应用。
能力矩阵
基于症状、体征、舌脉等多维信息,推理疾病诊断与证候类型,输出概率与置信度。
根据辨证结果与治法治则,生成处方建议,包括方剂组成、剂量、煎服法与禁忌。
自动生成随访问题、评估疗效变化、调整治疗方案,形成诊疗闭环。
回答中医药专业问题,引用典籍出处,支持医生学习与患者教育。
支持语音输入四诊信息,自动转写与实体识别,提升录入效率。
提供辨证、诊断、开方、问答等API接口,支持第三方应用集成。
模型架构
基座模型
基于Transformer架构,参数规模130亿(13B),采用Decoder-Only架构,支持上下文长度8K tokens,采用RoPE位置编码与GQA注意力机制优化推理效率。
预训练数据
- 中医典籍:《黄帝内经》《伤寒论》《金匮要略》等100+部经典著作,总计5亿tokens。
- 临床医案:历代名医医案、现代临床病例50万+份,总计10亿tokens。
- 研究文献:中医药期刊论文、学位论文30万+篇,总计15亿tokens。
- 知识图谱:症状、证候、疾病、方药、医家等实体与关系结构化知识。
指令微调
针对辨证、诊断、开方、随访、问答等场景,构建10万+高质量指令数据集,采用SFT(Supervised Fine-Tuning)+ RLHF(Reinforcement Learning from Human Feedback)两阶段微调,提升输出准确性与安全性。
知识增强
融合RAG(Retrieval-Augmented Generation)技术,推理时动态检索知识图谱与医案库,补充上下文信息,提升输出准确性与时效性。
训练流程
数据采集与清洗
采集中医典籍、医案、文献,清洗去重、格式规范化
预训练
基于海量文本进行自监督学习(Next Token Prediction)
指令微调(SFT)
使用标注指令数据集进行监督微调,提升任务准确性
人类反馈强化学习(RLHF)
专家标注偏好数据,训练奖励模型,优化输出安全性与可靠性
评估与迭代
临床专家评估、真实场景测试、持续迭代优化
多模态融合能力
视觉模态(图像)
舌诊图像:自动识别舌色(淡红/红/绛/紫)、舌形(胖大/瘦薄)、苔质(厚薄/腐腻),输出结构化舌诊报告。
面诊图像:分析面色(红/黄/青/黑/白)、色泽(润/枯)、部位(印堂/颧/鼻),辅助气血津液辨证。
皮肤图像:识别皮疹、斑块、疱疹等皮肤病变,辅助皮肤科疾病诊断。
语音模态
语音问诊:患者口述症状,自动转写文本、实体识别(症状/时间/程度),生成结构化病历。
五音辨证:分析发声音频,提取五音(角徵宫商羽)特征,辅助脏腑功能评估。
气体模态
闻诊分析:融合电子鼻气体"指纹"数据,联合推理证候类型与脏腑功能状态。
生理信号
脉诊数据:融合智能脉诊仪采集的脉象参数(脉位/脉力/流形),辅助辨证推理。
可解释性设计
- 推理路径可视化:展示从症状到证候、从证候到治法、从治法到方药的推理链路,每一步标注置信度与依据。
- 注意力权重分析:可视化模型对不同症状、体征的注意力权重,识别关键诊断依据。
- 典籍引用:输出内容引用经典条文、临床指南或名医医案,提供可追溯的知识来源。
- 对比分析:提供多种诊疗方案对比,展示各方案优劣与适用场景。
- 不确定性量化:输出诊断、证候、处方的置信度区间,提示医生关注低置信度结果。
应用场景
临床辅助诊疗
嵌入HIS/EMR系统,实时提供辨证、诊断、处方建议,辅助医生决策。
医学教育培训
提供病例讨论、模拟问诊、知识问答,辅助中医药学生与规培医生学习。
患者健康管理
患者端App,提供健康咨询、用药指导、随访提醒与疗效评估。
智能问答客服
医院官网/微信公众号智能客服,回答中医药常见问题。
科研数据分析
辅助医案挖掘、文献综述、证候聚类等科研任务。
应用开发赋能
通过API接口,第三方开发者快速构建中医智能应用。
API接口能力
| 接口名称 | 功能说明 | 输入示例 | 输出示例 |
|---|---|---|---|
/api/syndrome |
辨证推理 | 症状、体征、舌脉 | 证候类型、概率、置信度 |
/api/diagnosis |
疾病诊断 | 主诉、现病史、四诊信息 | 疾病诊断、鉴别诊断、依据 |
/api/prescription |
处方生成 | 证候、诊断、患者信息 | 方剂、药物、剂量、煎服法 |
/api/followup |
随访问题生成 | 初诊信息、治疗方案 | 随访问题列表、疗效评估量表 |
/api/qa |
知识问答 | 问题文本 | 答案、引用出处、置信度 |
/api/multimodal |
多模态推理 | 文本+图像+语音+脉象 | 综合辨证诊断结果 |
部署方式
- 云端API服务:开箱即用,按调用次数计费,适合轻量级应用场景。
- 私有化部署:本地GPU服务器部署(NVIDIA A100/A800),数据不出域,适合医院与科研机构。
- 混合部署:敏感推理本地化,通用问答云端化,兼顾性能与安全。
- 边缘部署:模型量化压缩至7B参数,部署至边缘设备(如移动端/嵌入式设备)。
应用价值
效率倍增
显著提升医生决策效率,辨证、开方、随访等环节自动化辅助。
知识标准化
推动中医知识标准化与算法化,形成可复用的行业能力底座。
开放生态
API赋能合作伙伴快速构建上层应用,形成中医智能化生态。
可信可控
可解释推理、本地化部署,医生可追溯AI决策,确保安全可控。
合规与隐私
- 本地化推理:支持离线部署与本地化推理,敏感数据不外传,符合《数据安全法》要求。
- 模型与数据分区:模型参数与训练数据分离存储,防止数据泄露。
- 训练数据脱敏:全流程脱敏与授权管理,患者隐私多层保护。
- 联邦学习支持:支持多机构数据联合训练,数据不出域,模型共享。
- 隐私计算:支持同态加密、安全多方计算等隐私计算技术,保障数据安全。
- 安全审计:全链路操作审计,模型输出内容安全审查,防止有害输出。
模型性能指标
| 评估维度 | 指标 | 性能 |
|---|---|---|
| 辨证准确率 | Top-1 Accuracy | 85.6% |
| 诊断准确率 | Top-3 Accuracy | 92.3% |
| 处方合理性 | 专家评分(1-5分) | 4.2/5.0 |
| 知识问答 | F1 Score | 88.7% |
| 推理速度 | 单次推理时间(A100) | <2秒 |
| 上下文长度 | 最大Tokens | 8192 |
典型应用案例
某三甲中医院HIS集成
场景:医生工作站嵌入AI辅助,减少重复劳动,提升诊疗效率。
方案:通过API集成华智云翳大模型,医生录入症状后自动提示辨证与处方建议。
效果:辨证时间从5分钟缩短至30秒,处方生成效率提升70%,医生满意度90%+。
某中医药大学教学平台
场景:学生缺乏真实病例训练,辨证能力培养效率低。
方案:基于大模型开发病例讨论系统,学生提交辨证方案后,AI提供评分与改进建议。
效果:学生辨证训练量增加5倍,考试通过率提升30%,教学反馈优秀。