智能交互赋能医疗健康领域的三要素
人工智能交互技术在过去20年间从简单的将文字变成声音的语音合成技术,逐步发展到了如今融合图像视觉的多模态智能交互。
以语音交互为主的智能交互赋能医疗健康领域有三个要素,分别是核心技术、医疗大数据与医学专家。核心技术由感知智能与认知智能技术组成,让机器不仅能听、会看、会说,还能理解与思考,尤其是医疗相关领域的知识图谱理解。医疗大数据包含医学相关教科书、脱敏电子病历、临床指南与文献等。医学专家负责将数据转化为计算机能够理解的知识。三要素相互协调,齐头并进,为智能交互赋能医疗健康提供了有力支撑。
智能交互赋能医疗健康
医疗人工智能技术与人类医生的关键能力有如下对映:
(来源:程美,企明星沙龙讲稿资料)
医学知识学习:让机器读懂每一本医学教材、每一篇指南及专家共识和每一份病例报告;
诊疗推理:针对复杂多变病情,让机器具备时序个性化跨专科的处理能力,结合实际定期变化的临床状况及专病到专科的治疗体系,构建动态的、多学科协调的知识图谱;
健康交互:围绕医疗健康主题,让机器具备多模态交互能力,包括实际工作中的健康宣教、体检筛查等。
目前,这三大关键技术的研究主要集中在中国、美国与欧洲。除大家都在建立的医学知识库以外,国内大部分公司将目光聚焦在诊疗推理领域,而国外则将更多的精力放在了医疗健康交互的开发应用上。
医疗健康交互的类型
医疗健康交互可以简单分为人机交互与人人交互。人机交互顾名思义,是人与机器的对话,场景包括电子病历录入,医技科室报告采集,语音导诊等,用于提高交互效率,降低对人工的依赖。人机对话不能完全解决人跟人之间沟通的问题,所以在医学场景中更多的还是扮演智能辅助的角色。
人机交互对话系统
对话系统主要由问答系统,任务型对话系统和开放域对话系统组成。
(来源:程美,企明星沙龙讲稿资料)
问答系统:检索式多轮问答,在客服系统或首页回答用户提问。核心要点在于构建相似度模型以及问答库,使得系统可以通过提问与问答库中已有数据的相似度打分排序选出最适合的回答。
开放域对话系统:生成式多轮问答,针对通用场景的聊天系统,入院出院均可使用。目前最新的技术为编码-解码(Encoder-Decoder)框架,结合大规模的问答库来训练模型,确保答案有效可控
(来源:程美,企明星沙龙讲稿资料)
任务型对话系统:涉及对话流的设计,需要前期梳理业务流程场景,从而实现在不同阶段能做出合适的反馈,提出适合当前情景的问题。实现流程包括语音识别,自然语言理解,对话管理(对话状态追踪与对话策略优化)以及自然语言生成。
(来源:程美,企明星沙龙讲稿资料)
医疗智能交互创新应用落地
人工智能实现应用价值兑现的两个重要方向分别是人机交流无障碍与学习行业专家知识,辅导普通专业人士。落地到智能交互产品上,其创新应用价值兑现的三大标准是:
1.具备真实可见的应用案例:能够真的运用起来
2.能够规模化推广的应用产品:能够量大面广地集中使用
3.可用统计数据证明应用成效:可以通过数据统计证明其对于效益的提升
医疗场景中的创新应用案例
医疗健康智能交互产品主要具备六大可用能力:能听、会说、能看、会认、能理解会思考。同时医疗健康智能交互产品的研发需要稳定的团队投入、权威知识、基础设施的多方面保障,实际应用时需要结合考虑投入成本与业务场景的匹配程度。程美分享了以下语音交互在医疗领域中的创新案例:
急诊科的语音调度状态提醒:具备在各个急救环节中语音播放提醒医生、呼叫院内急症科、病历录入和检索等功能。
(来源:程美,企明星沙龙讲稿资料)
唇腭裂疾病语音评估:辅助或替代医生进行唇腭裂疾病的语音评估,给出语音问题以及疾病诊断。未来可以唇腭裂疾病为抓手,逐步扩展,搭建全国的医疗语音数据平台,包含疾病诊断过程中的语音数据以及诊疗过程数据,具备科研价值以及与公益慈善机构合作的社会宣传价值。
智能外呼-医疗虚拟助手对话系统:语音合成识别加语义处理技术,同时辅以不断更新的话术知识库,使其能够适应不断扩展的应用场景。
(来源:程美,企明星沙龙讲稿资料)
嘉宾问答
问:请问智能交互技术在医疗健康领域的应用过程中,给您留下深刻印象的挑战是什么?
程美:刚开始我们在做导诊的对话系统的时候,每天安排了十几个人在后台搜集现场的数据,去持续迭代优化这个效果,经过几个月的投入之后就比较稳定了。但是现在做偏开放领域的诊后管理产品时,尽管做了很多优化,实际投入使用效果并不是很满意。实际过程中不知道该从哪里优化,因为咨询的问题可能是偏医学的,需要预留健康管理师这一块的成本投入,并且每家医院的健康宣教、出院随访的都不一样,到了上线过程中,如何区分共性的知识都需要前期细致的优化处理。
请问您觉得之后会有哪些粘性更大的场景,更能突出智能交互本质的优势呢?
程美:智能交互本身考虑的是双手被占用的情况下去做的交互体验,同时受限于录音采集。我们也调研过许多场景,像手术里器械清点和患者病历查询。但是手术场景下是无法安装麦克设备的,所以硬件上也需要一点迭代创新,比如采用吸顶式的全方位声音采集辅以声源定位。在实际开发中还是要考虑在不改变现有的一些工作流程,用技术去适应,提升一些便捷,才可能会持续地用起来。
文中使用的图片及资料或已经过授权,或已标注引用来源,其他机构和个人请勿自用于改编和二次传播