华智云翳大模型

行业预训练 + 指令微调 · 可解释推理

产品概述

华智云翳大模型是面向中医药领域的行业大语言模型,基于海量中医典籍、临床医案、现代研究文献与真实诊疗数据进行预训练与指令微调,覆盖诊断推理、处方生成、随访管理、知识问答等核心场景。模型支持私有化部署与API开放,融合专家知识蒸馏、术语规范增强与多模态扩展能力,为中医智能化提供可解释、可信赖的AI底座。

华智云翳大模型架构图

核心优势

  • 行业预训练:基于100万+中医典籍、50万+临床医案、30万+研究文献进行预训练,深度理解中医术语、证候逻辑与诊疗思维。
  • 指令微调优化:针对辨证、诊断、开方、随访等场景进行指令微调(Instruction Tuning),提升任务准确性与输出规范性。
  • 专家知识蒸馏:将名医经验与临床指南蒸馏为模型参数,实现隐性知识显性化。
  • 术语规范增强:内置中医临床术语系统(TCMLS)、ICD-11中医证候编码,确保输出标准化。
  • 可解释推理:基于知识图谱与注意力机制可视化推理路径,医生可追溯AI决策依据。
  • 多模态扩展:支持语音、气体、图像等多模态输入,融合四诊信息进行综合推理。
  • 私有化部署:支持本地化推理与离线部署,保护数据隐私与安全。
  • API能力开放:提供RESTful API与SDK,赋能合作伙伴快速构建上层应用。

能力矩阵

智能诊断

基于症状、体征、舌脉等多维信息,推理疾病诊断与证候类型,输出概率与置信度。

智能开方

根据辨证结果与治法治则,生成处方建议,包括方剂组成、剂量、煎服法与禁忌。

随访管理

自动生成随访问题、评估疗效变化、调整治疗方案,形成诊疗闭环。

知识问答

回答中医药专业问题,引用典籍出处,支持医生学习与患者教育。

语音理解

支持语音输入四诊信息,自动转写与实体识别,提升录入效率。

API能力开放

提供辨证、诊断、开方、问答等API接口,支持第三方应用集成。

模型架构

基座模型

基于Transformer架构,参数规模130亿(13B),采用Decoder-Only架构,支持上下文长度8K tokens,采用RoPE位置编码与GQA注意力机制优化推理效率。

预训练数据

  • 中医典籍:《黄帝内经》《伤寒论》《金匮要略》等100+部经典著作,总计5亿tokens。
  • 临床医案:历代名医医案、现代临床病例50万+份,总计10亿tokens。
  • 研究文献:中医药期刊论文、学位论文30万+篇,总计15亿tokens。
  • 知识图谱:症状、证候、疾病、方药、医家等实体与关系结构化知识。

指令微调

针对辨证、诊断、开方、随访、问答等场景,构建10万+高质量指令数据集,采用SFT(Supervised Fine-Tuning)+ RLHF(Reinforcement Learning from Human Feedback)两阶段微调,提升输出准确性与安全性。

知识增强

融合RAG(Retrieval-Augmented Generation)技术,推理时动态检索知识图谱与医案库,补充上下文信息,提升输出准确性与时效性。

训练流程

1

数据采集与清洗

采集中医典籍、医案、文献,清洗去重、格式规范化

2

预训练

基于海量文本进行自监督学习(Next Token Prediction)

3

指令微调(SFT)

使用标注指令数据集进行监督微调,提升任务准确性

4

人类反馈强化学习(RLHF)

专家标注偏好数据,训练奖励模型,优化输出安全性与可靠性

5

评估与迭代

临床专家评估、真实场景测试、持续迭代优化

多模态融合能力

视觉模态(图像)

舌诊图像:自动识别舌色(淡红/红/绛/紫)、舌形(胖大/瘦薄)、苔质(厚薄/腐腻),输出结构化舌诊报告。

面诊图像:分析面色(红/黄/青/黑/白)、色泽(润/枯)、部位(印堂/颧/鼻),辅助气血津液辨证。

皮肤图像:识别皮疹、斑块、疱疹等皮肤病变,辅助皮肤科疾病诊断。

语音模态

语音问诊:患者口述症状,自动转写文本、实体识别(症状/时间/程度),生成结构化病历。

五音辨证:分析发声音频,提取五音(角徵宫商羽)特征,辅助脏腑功能评估。

气体模态

闻诊分析:融合电子鼻气体"指纹"数据,联合推理证候类型与脏腑功能状态。

生理信号

脉诊数据:融合智能脉诊仪采集的脉象参数(脉位/脉力/流形),辅助辨证推理。

可解释性设计

  • 推理路径可视化:展示从症状到证候、从证候到治法、从治法到方药的推理链路,每一步标注置信度与依据。
  • 注意力权重分析:可视化模型对不同症状、体征的注意力权重,识别关键诊断依据。
  • 典籍引用:输出内容引用经典条文、临床指南或名医医案,提供可追溯的知识来源。
  • 对比分析:提供多种诊疗方案对比,展示各方案优劣与适用场景。
  • 不确定性量化:输出诊断、证候、处方的置信度区间,提示医生关注低置信度结果。

应用场景

临床辅助诊疗

嵌入HIS/EMR系统,实时提供辨证、诊断、处方建议,辅助医生决策。

医学教育培训

提供病例讨论、模拟问诊、知识问答,辅助中医药学生与规培医生学习。

患者健康管理

患者端App,提供健康咨询、用药指导、随访提醒与疗效评估。

智能问答客服

医院官网/微信公众号智能客服,回答中医药常见问题。

科研数据分析

辅助医案挖掘、文献综述、证候聚类等科研任务。

应用开发赋能

通过API接口,第三方开发者快速构建中医智能应用。

API接口能力

接口名称 功能说明 输入示例 输出示例
/api/syndrome 辨证推理 症状、体征、舌脉 证候类型、概率、置信度
/api/diagnosis 疾病诊断 主诉、现病史、四诊信息 疾病诊断、鉴别诊断、依据
/api/prescription 处方生成 证候、诊断、患者信息 方剂、药物、剂量、煎服法
/api/followup 随访问题生成 初诊信息、治疗方案 随访问题列表、疗效评估量表
/api/qa 知识问答 问题文本 答案、引用出处、置信度
/api/multimodal 多模态推理 文本+图像+语音+脉象 综合辨证诊断结果

部署方式

  • 云端API服务:开箱即用,按调用次数计费,适合轻量级应用场景。
  • 私有化部署:本地GPU服务器部署(NVIDIA A100/A800),数据不出域,适合医院与科研机构。
  • 混合部署:敏感推理本地化,通用问答云端化,兼顾性能与安全。
  • 边缘部署:模型量化压缩至7B参数,部署至边缘设备(如移动端/嵌入式设备)。

应用价值

效率倍增

显著提升医生决策效率,辨证、开方、随访等环节自动化辅助。

知识标准化

推动中医知识标准化与算法化,形成可复用的行业能力底座。

开放生态

API赋能合作伙伴快速构建上层应用,形成中医智能化生态。

可信可控

可解释推理、本地化部署,医生可追溯AI决策,确保安全可控。

合规与隐私

  • 本地化推理:支持离线部署与本地化推理,敏感数据不外传,符合《数据安全法》要求。
  • 模型与数据分区:模型参数与训练数据分离存储,防止数据泄露。
  • 训练数据脱敏:全流程脱敏与授权管理,患者隐私多层保护。
  • 联邦学习支持:支持多机构数据联合训练,数据不出域,模型共享。
  • 隐私计算:支持同态加密、安全多方计算等隐私计算技术,保障数据安全。
  • 安全审计:全链路操作审计,模型输出内容安全审查,防止有害输出。

模型性能指标

评估维度 指标 性能
辨证准确率 Top-1 Accuracy 85.6%
诊断准确率 Top-3 Accuracy 92.3%
处方合理性 专家评分(1-5分) 4.2/5.0
知识问答 F1 Score 88.7%
推理速度 单次推理时间(A100) <2秒
上下文长度 最大Tokens 8192

典型应用案例

某三甲中医院HIS集成

场景:医生工作站嵌入AI辅助,减少重复劳动,提升诊疗效率。

方案:通过API集成华智云翳大模型,医生录入症状后自动提示辨证与处方建议。

效果:辨证时间从5分钟缩短至30秒,处方生成效率提升70%,医生满意度90%+。

某中医药大学教学平台

场景:学生缺乏真实病例训练,辨证能力培养效率低。

方案:基于大模型开发病例讨论系统,学生提交辨证方案后,AI提供评分与改进建议。

效果:学生辨证训练量增加5倍,考试通过率提升30%,教学反馈优秀。

了解更多或申请试用

如需详细技术文档、API接口文档、私有化部署方案或申请试用账号,请联系我们的售前团队。

联系我们 返回产品列表