基于语音交互技术的健康检测系统设计

(整期优先)网络出版时间:2023-09-22
/ 3

基于语音交互技术的健康检测系统设计

李航硕 唐友业 赵俊通讯作者:肖利君

湖南工业大学 电气与信息工程学院 湖南 株洲 412000

摘 要:针对目前健康检测设备还存在的不易携带,老年人和视力障碍群体使用不便,疫情发生时难以实现准确无接触检测等问题,本文设计了一种基于语音交互技术的健康检测系统。以STM32F103ZET6为核心板,通过语音交互提示,利用基于MLX90614的温度测量模块和基于MAX3012的心率、血氧测量模块做到全程无接触检测人体生命特征,并对检测数据进行实时记录和动态分析,若出现异常值及时报警并播报健康提示。本系统可将温度、血氧、心率的测量误差控制在2%以内,对于老年人和视力障碍群体的健康检测普及和智能医疗的发展具有重大意义。

关键词:语音交互;无接触检测;动态分析;智能医疗

Design of a Health Detection System Based on Voice Interaction Technology

XIAO Lijun, LI Hangshuo,TANG Youye,ZHAO Jun

(College of Electrical and Information Engineering,Hunan University of Technology,Zhuzhou,412000,China)

Abstract:In response to the current issues of health detection equipment being difficult to carry, inconvenient for the elderly and visually impaired, and difficult to achieve accurate contactless detection during the epidemic, this article designs a health detection system based on voice interaction technology. With STM32F103ZET6 as the core board, through voice interactive prompt, the temperature measurement module based on MLX90614 and the heart rate and blood oxygen measurement module based on MAX3012 can achieve non-contact detection of human life characteristics throughout the whole process, and conduct real-time recording and dynamic analysis of the detection data. If outlier are found, alarm in time and broadcast health prompts. This system can control the measurement error of temperature, blood oxygen, and heart rate within 2%, which is of great significance for the popularization of health testing and the development of intelligent medicine for the elderly and visually impaired groups.

Keywords:voice interaction;Contactless detection;dynamic analysis;Intelligent healthcare

0引言

语言是人类最原始直接的一种交流方式,通俗易懂、便于理解.随着科技的发展,语言交流不再只存在于人与人之间,如何让机器“听懂”人类的语言并做出反应成为人工智能的重要课题,语音智能交互技术应运而生。作为其中重要一环的语音识别技术近年来不断发展,走出了实验室,随着人工智能进入人们的日常生活中。当今市场上语音识别技术相关的软件、商品涉及人类生活的方方面面,语音识别的实用性已经得到充分的印证。如今语音识别技术已经成为人类社会智能化的关键一步,能够极大提高人们生活的便捷度。

近年来我国老龄化日益严重,根据2020年11月1日第七次全国人口普查的数据,我国60岁以上的老人有2.64亿人,所占比例为18.70%,我国已经进入中度老龄化阶段,然而75%的老年人患有慢性病,所以进行相关指标的检测对慢性病的治疗非常重要。为此,本文设计了一种基于语音交互技术的健康检测系统,通过识别语音指示,用红外传感器做到无接触检测人体生命体征如体温、血氧和心率,并对检测数据进行实时记录和动态分析,检测的数据通过扬声器播放。当躯体生理功能出现异常时,提供适当的预警信息以使用户了解自己的生理变化,还可以为医生的初步诊断提供依据。

1 MCU与健康指标检测

健康指标检测包含红外测温传感器和心率血氧模块。红外测温传感器采用迈来芯公司的MLX90614芯片,这是一款非接触式测量温度的红外温度计。对于测心率、血氧模块将直接采用市面上普遍使用的MAX30100模块,MAX30100是一款集成有脉搏血氧仪和心率监测传感器的模块,它的内部集成了一整套完整信号采集电路,包括光信号发射及接收、AD转换、环境光的干扰消除等,留给用户使用的接口只有J1 CON7的数据的输入输出。用户只需通过MCU的模拟IIC,实现对MAX30100内部的寄存器进行读写操作,得到经过数模转换器转换之后的ADC值,最后通过相应的算法计算出心率值和血氧饱和度。

MCU与检测模块采用IIC通讯方式,“类IIC”就是SMBus模式,是一种高效同步的串行总线,SMBus有SCL时钟线和SDA数据线,通过这两根线与其他设备进行通信,传输数据,MCU功能与检测模块通讯传输如图1所示。

图1  MCU功能与检测模块通讯传输

2 语音识别

常用的语音识别算法模型有隐马尔科夫模型(HMM)、高斯混合模型(GMM)、长短时记忆网络(LSTM)、神经网络(CNN) [2]等。由于神经网络只能逐帧判别语音特征,为了描述语音信号的时变特性,结合改进门结构的循环神经网络与隐马尔可夫模型,构建了RNN-HMM混合声学模型[3]。声学模型的神经网络部分用于计算语音特征的输出概率,HMM系统在模型训练时提供了语音帧与音素间的对齐,以及用于解码时计算各状态间的转移概率。声学模型结合语言学相关的语言模型(Language Model)和发音字典(lexicon)共同组成基于加权有限状态转换器(Weighted Finite StateTransducers,WFST)[4]的语音识别解码器,RNN-HMM 混合声学模型的语音识别系统如图2所示。

图2 RNN-HMM 混合声学模型

3语音合成

隐马尔科夫模型(Hidden Markov Model)是语音合成技术最常用的模型, 因其系统结构简单, 基本上不需要任何语言学知识指导系统训练, 构建时间短, 构建过程基本不需要人为干涉, 因此被研究者所青睐. HMM 应用于语音信号的建模技术已经比较成熟, 基于 HMM 的语音合成技术其本质上也是一种参数合成方法,所以本项目采用了这种模型进行分析应用。

基于 HMM 的语音合成过程主要分为两个阶段: 训练阶段和合成阶段. 在训练阶段, 首先对存储的音库进行参数提取, 主要包括: 梅尔倒频谱系数(MFCC)和基频(F0)参数[5]. 然后根据提取的声学参数以及语音数据对应的标注文件为每个语音合成单元建立各自的模型, 这些模型是训练好的单音素模型, 因此还需要设计上下文属性集合的来对模型进行扩展, 再对扩展后的模型继续训练. 在合成阶段, 首先对给定的文本通过文本分析模型进行分析, 并根据文本的上下文关系在一定程度上对文本进行理解, 然后在 HMM 模型作用下进行目标模型判决并且在连续密度隐马尔科夫模型(CD-HMM) [6]下生成参数序列, 最后将参数序列送入合成器中合成出语音, 如图3所示。

图3 基于HMM 的语音合成系统框图

4 显示界面

基于Qt跨平台集成开发环境搭建开发环境,使用c++语言编程,该语言是面向对象,通过qt中独有的信号与槽机制使各个对象之间进行通信。qt还提供了大量的封装完好的模块,本系统主要用到数据库、线程等模块。屏幕上有三种界面可以显示,分别是用户界面、主界面和游戏界面,并在代码中创建了三种对象类,依次为result类,mainwindow类,mygame类。三个对象类之间也是通过信号与槽机制进行数据互通。通过改写qt中自带的线程函数,创建了两个线程,主线程实现界面的功能,另外一个线程接收来自STM32的数据。达到可以随时接受数据,且界面功能可以正常工作。用户在主界面可以看到一些基本指标,包括体重、体温、脉搏、血压、睡眠的指标。在主界面用户可以注册,登录自己的账户,主界面接收到来自MCU的测量数据时,不会保存测量数据,只会显示测量数据,并分析。用户在用户界面可以查看自己最近几次的测量结果和分析报告。屏幕显示界面设计流程图如图4所示。

图4 屏幕显示界面设计流程图

5 硬件总体架构设计

将STM32F103ZET6最小系统板作为此次设计的核心板,系统主要由语音识别模块、语音合成模块、检测模块和显示模块等组成,系统总体架构如图5所示。

图5 系统总体架构图

6 系统软件设计

首先,判断是否有外界语音信息输入,若检测到输入的语音信号是“健康检测”,则可以开始进行人体体温,心率和血氧信息检测的操作,之后通过语音合成模块将采集到的信息进行播报,并将这些信息数据通过串口传输到显示屏上显示。若检测到的语音输入是相关医学问题,语音识别模块将会去检索相关问题及其解答,并将相关解答再通过语音合成模块播报出来,同时也会将相关问题及其解答显示在触摸屏上。其次,将实现触摸屏的交互操作,判断是否有收到从外界产生的触屏信号,若有接收到外界的交互信号,则执行相应的操作。具体的软件流程框图如图6所示。

图6 软件流程框图

7.实物测试结果分析

触摸屏显示界面可以实现显示被测者的温度、心率和血氧值,根据测量值给出正确的结果分析报告,系统的用户界面设计得美观,操作舒适、简单,界面显示效果如图7所示。系统有存储被测者测量数据的功能,以柱状图显示存储的数据,让被测者可以清楚方便的知道最近的身体情况,显示效果如图8所示。

图片1

图7 系统用户界面

图8 注册用户测量结果显示图

系统对用户的血氧、心率、体温进行了多次采样,并把采样结果和实际值进行了比较绘制出折线图,如图11、12、13所示。通过测量可以得出,对用户的血氧、心率、体温测量误差可以控制在2%以内,能实现精确无接触测量。

图9 血氧实际值与采样值示意图            图10 温度实际值与采样值示意图

图11 心率实际值与采样值示意图

8 结语

本系统区别于普通产品的单一语音播报技术,采用语音识别和语音播报双重技术,利用语音识别和红外传感器对用户身体特征进行全程无接触检测和分析从而降低了病毒传染风险。实现了无接触温度、心率和血氧测量,后期可以对其功能进行扩展,扩展成实现血压、血脂、血糖等多功能测量,所以系统有很强的扩展性,也可以为医疗平台、医院等应用场所提供技术支持与服务,而且可广泛应用于便携式家庭医疗设备、无接触检测等领域,具有良好的推广性。

参考文献:

[1] 张军,马自路.一种智能远程居家养老看护系统.202110176703.X[P].2021-06-18

[2] 臧亮. 国内智能音箱行业发展状况研究[J]. 中国广播, 2018, 305(11):27-30. 

[3]竺宝宝, 张娜. 基于深度学习的自然语言处理[J]. 无线互联科2017(10):25-26.

[4]俞建强,颜雁,刘葳,孙一鸣. 基于改进门控单元神经网络的语音识别声学模型研究[J]. 长春理工大学学报 (自然科学版), 2020,43(1):20-23.

[5] 华凯晨,王晖,张振宇,等.基于语音合成的残疾人辅助交互系统的设计与实现[J].信息与电脑,2019,(16):77-79.

[6]于茵茵,王旭东.语音识别技术在口腔门诊病历系统中的应用[J].河南科技,2019(23):36-38.