本发明提出了一种非接触式生命传感器的身份识别系统及方法,属于非接触式人员检测技术领域。系统包括非接触式传感器接收子系统,用于接收非接触式传感器发送的数据报文并提取呼吸生命体征数据;生命数据数据库子系统,用于存储获取到的呼吸生命体征数据;数据预处理子系统,对呼吸生命体征数据进行筛选、分割处理并提取呼吸特征值;模型训练子系统,对特征值序列进行训练并获得分类识别模型;身份识别子系统,将经过处理的数据片段输入分类识别模型,从而获得分类识别结果以进行身份比对。通过上述系统能够在仅获取少量的呼吸生命体征数据片段的情况下,实现对用户身份信息的识别,该方法具有更高的灵活性、安全性和隐私保护性。
1.一种非接触式传感器的身份识别系统,其特征在于,包括非接触式传感器接收子系统,生命数据数据库子系统,数据预处理子系统,模型训练子系统,身份识别子系统;
所述的非接触式传感器接收子系统,接收非接触式传感器发送的数据报文并进行呼吸数据的提取;
所述的生命数据数据库子系统,存储非接触式传感器数据接收子系统获取到的呼吸数据到计算机内部的数据库存储表中;
所述的数据预处理子系统,对生命数据数据库子系统中存储的呼吸的数据进行异常值的处理、呼吸片段分割操作,进行呼吸特征提取、二次特征的特征提取操作;
所述的模型训练子系统,对数据预处理子系统得到的特征值序列进行训练,得到分类识别模型;
所述的身份识别子系统,输入部分呼吸生命体征数据片段,经过处理后输入到模型训练子系统中预先训练完成的分类识别模型中进行身份识别。
2.根据权利要求1所述的非接触式传感器的身份识别系统,其特征在于,所述的非接触式传感器接收子系统通过UDP协议的方式不断获取非接触式传感器发送的监测用户生命体征的数据报文。
3.根据权利要求1所述的非接触式传感器的身份识别系统,其特征在于,所述的非接触式传感器接收子系统在呼吸数据提取上,首先对数据报文的正确性进行报头帧校验、数据包长度校验、数据包校验和校验验证,其次对报文中的呼吸数据进行提取。
4.根据权利要求1所述的非接触式传感器的身份识别系统,其特征在于,所述的生命数据数据库子系统储存非接触式传感器接收子系统中获得的呼吸数据,并对呼吸数据所属的用户使用唯一标识来进行区分。
5.根据权利要求1所述的非接触式传感器的身份识别系统,其特征在于,所述的数据预处理子系统首先进行呼吸数据的异常值处理和呼吸片段分割,其次进行呼吸特征提取和二次特征提取,提取到呼吸特征值向量序列。
6.根据权利要求5所述的非接触式传感器的身份识别系统,其特征在于,所述的异常值处理为,对传感器监测不到用户生命体征导致生命数据数据库子系统中存储的用户呼吸数据为空值的数据进行删除处理;
所述的呼吸片段分割为,对每个用户经过异常值处理后的数据,进行时间长度为连续60s的生命体征数据分割,并对分割后的生命体征数据进行整合;
所述的呼吸特征提取为,从整合后的呼吸片段中提取出以下特征:
呼吸平均频率、呼吸平均深度、呼吸深度面积、呼吸峰值偏差、呼气平均速度、吸气平均速度、呼气平均间隔时间、吸气平均间隔时间、呼气间隔时间标准差、吸气间隔时间标准差;
所述的二次特征提取为,对提取出的呼吸特征进行标准化、PCA主成分分析方法中利用奇异值分解SVD的协方差矩阵,来获得二次提取中的呼吸特征值向量序列。
7.根据权利要求6所述的非接触式传感器的身份识别系统,其特征在于,二次特征提取中所述的标准化为,对呼吸特征使用Z-score标准化的方法来进行标准化。
8.根据权利要求1所述的非接触式传感器的身份识别系统,其特征在于,所述的模型训练子系统将经过数据预处理子系统处理得到的不同用户的呼吸特征值向量序列进行离线或者在线训练,生成随机森林算法的分类识别模型。
9.根据权利要求1所述的非接触式传感器的身份识别系统,其特征在于,所述的身份识别子系统通过非接触式传感器接收子系统获取的呼吸数据片段,经过特征提取处理后,输入到生成的分类模型中,将模型的分类结果与生命数据数据库子系统中的生命体征数据库存储中的身份标识进行比对,进行用户身份的验证。
10.一种非接触式传感器的身份识别方法,其特征在于,所述方法通过权利要求1到9任一项所述的系统实现,包括如下步骤:
步骤S1:从非接触式传感器接收子系统中采用随机截取的方式,提取出部分实时的生命体征数据片段;
步骤S2:对截取的数据片段进行呼吸特征值提取,并使用标准化、主成分分析的奇异值分解的方法处理,获得特征向量作为新的呼吸特征值序列;
步骤S3:对步骤S2获得的呼吸特征值序列输入到预先训练完成的分类识别模型中,分类器识别模型输出一个身份标识编号作为结果,参与对用户的身份信息比对;
步骤S4:从生命数据数据库子系统中存储的用户身份标识读取出身份标别编号序列,参与对用户的身份信息比对;
步骤S5:将步骤S3中分类器识别模型输出的分类结果与步骤S4中获取的生命体征数据库存储的用户身份标识编号序列进行比对,完成对用户的身份信息验证。
技术领域
[0001]本发明属于非接触式人员检测技术领域,涉及一种采用机器学习技术的非接触式传感器的身份识别系统及身份识别方法。
背景技术
[0002]基于生物特征的非接触式识别技术,在不接触人体的情况下,通过检测人体生理活动引起的各种微动或者人体生理结构上的特征,通过对获取的生理数据进行特征提取分析,进而来实现非接触式的、远距离的生命体征信号的识别。
[0003]目前,基于生物特征的非接触式的身份识别技术包括声纹识别、面部识别、视网膜识别等技术。然而这些方法都存在一定的限制。声纹识别容易受到环境噪音的干扰,可能导致识别准确性下降。面部识别受到光线照射、拍摄角度等环境因素的影响,也可能对身份识别的准确性造成影响。对于视网膜识别,其获取视网膜图像需要高精度的专业设备和专业操作,实用性不高。此外,声纹识别和面部识别均存在隐私泄露的风险,这也会引发在安全性方面的担忧。
[0004]而基于呼吸信号的生命体征身份识别也是一种非接触式的生物特征识别技术,其通过提取人体呼吸运动模式的生理特征来实现身份识别的目的。作为生物医学信号,呼吸运动具有独特的生物特征信息,具备唯一性。人体的呼吸运动分为吸气和呼气两个过程,在吸气时,胸腔的尺寸会增大,而在呼气时则会缩小。非接触式传感器可以通过监测呼吸运动中胸腔的变化,来获取到人体呼吸产生的呼吸幅度。此外,个体的呼吸具有独特的特征并可以长期保留,难以伪造。因此,采用该信号进行生物特征识别,具有可靠性。
[0005]非接触式传感器采用毫米波技术来检测人体,其工作过程不受光线、遮挡物等干扰因素影响。因此,即使在光线不佳甚至黑暗的条件下,以及存在烟尘等遮挡物干扰的环境中,传感器仍能正常工作。其工作原理和适应的工作环境可以使得个人隐私得到有效的保护。
[0006]综上所述,现有基于生物特征的非接触式身份识别系统存在着易于伪造、隐私泄露以及受光线环境影响等问题。
发明内容
[0007]针对上有技术的不足,利用人体呼吸运动模式的唯一性,本发明提供一种基于非接触式传感器的身份识别系统和方法。
[0008]一方面,本发明提出了一种基于非接触式传感器的身份识别系统。
[0009]非接触式传感器的身份识别系统包括以下子系统:非接触式传感器接收子系统,生命数据数据库子系统,数据预处理子系统,模型训练子系统,身份识别子系统。
[0010]本发明非接触式传感器数据接收子系统,具体为:非接触式传感器数据接收子系统分为数据接收模块、数据解析模块;
[0011]进一步的,对于数据接收模块具体为,传感器监测得到的数据,通过传感器以发送报文的形式发送到非接触式传感器接收子系统的数据接收模块;
[0012]对于数据解析模块具体为,将数据接收模块接收到的数据报文传递给数据解析模块进行解析,将报文中的呼吸生命体征数据进行读取,并交由生命数据数据库子系统进行储存。
[0013]本发明生命数据数据库子系统,具体为:将非接触式传感器接收子系统解析得到的呼吸生命体征数据存储到数据库中。
[0014]本发明数据预处理子系统,具体为:对生命数据数据库子系统中存储的呼吸振幅的生命体征数据进行异常值的处理、呼吸片段分割、呼吸特征提取、二次特征提取的操作;
[0015]进一步的,异常值处理具体为,对由于网络传输异常、用户暂时离开产生的体征数据空值、异常值进行筛选摘除处理;
[0016]呼吸片段分割具体为,对每个用户进行连续60s长度的生命体征数据分割,并对多次分割后的生命体征数据进行整合;
[0017]呼吸特征提取具体为,从呼吸振幅数据中提取出呼吸平均频率、呼吸平均深度、呼吸深度面积、呼吸峰值偏差、呼气平均速度、吸气平均速度、呼气平均间隔时间、吸气平均间隔时间、呼气间隔时间标准差、吸气间隔时间标准差的呼吸特征;
[0018]二次特征提取具体为,由于呼吸特征值的量纲不同,为了减少输入特征值的尺度对模型结果的影响,同时保留自身的变化趋势,对特征值数据进行特征标准化处理。同时不同呼吸特征件存在潜在的关系,进一步发掘原特征间隐藏的关系,减少原有呼吸特征的信息损失,使用基于奇异值分解(SVD)的协方差矩阵的PCA主成分分析方法来进行二次特征提取,生成新的呼吸特征值向量序列。所述的标准化为,对呼吸特征使用Z-score标准化的方法来进行标准化。
[0019]本发明模型训练子系统,具体为:对数据预处理子系统得到的呼吸特征值向量序列,使用随机森林算法进行分类识别模型的训练,训练完成得到分类识别模型;
[0020]进一步的,随机森林算法模型具体为,采用集成学习思路的随机森林算法对生成的特征值向量数据进行训练。将得到的呼吸特征值向量序列输入到随机森林中进行训练,在随机森林算法的训练过程中会随机抽样产生多个训练集并构建多棵分类决策树,也就是基分类器。在执行算法上,生成的决策树分类器共同参与执行,最后由所有决策树分类器以投票的方式来决定最终的分类结果。
[0021]本发明身份识别子系统,具体为:对非接触式传感器数据接收子系统解析得到的部分呼吸生命体征数据片段,经过本发明提出的基于非接触式传感器的身份识别方法来进行身份识别对比的实现。
[0022]另一方面,本发明还提出了一种基于非接触式传感器的身份识别方法,包括:
[0023]步骤1:获取非接触式传感器的生命体征数据片段;
[0024]步骤2:对获取的生命体征数据进行呼吸片段特征提取;
[0025]步骤3:将呼吸片段特征输入到分类模型获得分类结果;
[0026]步骤4:从数据库中获得身份标别编号序列。
[0027]步骤5:进行身份信息的比对验证。
[0028]所述步骤1具体包括:从非接触式传感器接收子系统中采用随机截取的方式,提取出部分实时的生命体征数据片段。
[0029]所述步骤2具体包括:对截取的数据片段进行呼吸特征值提取,并进行标准化、主成分分析的奇异值分解的方法处理,获得特征向量作为新的呼吸特征向量表示。
[0030]所述步骤3具体包括:对步骤2中获得的呼吸特征向量输入到预先训练存储的模型分类器中,分类器模型会输出一个身份标识编号,参与用户身份信息的识别比对。
[0031]所述步骤4具体包括:从生命数据数据库子系统中读取存储的用户身份标识编号序列,参与用户身份信息的识别比对。
[0032]所述步骤5具体包括:通过步骤3中输出的身份标识编号与步骤4中获得的用户身份标识编号序列进行比对,从而完成用户身份验证的过程。
[0033]总体而言,本发明所构思的以上技术方案与现有技术相比,采用非接触式传感器进行身份识别,具有较高的灵活性、安全性和隐私保护性:
[0034]灵活性:在存在遮挡物的情况下,不会受到烟尘、遮挡物等环境或人为因素的影响。此外,在工作时不受到环境条件的限制,在光线不足、黑暗等场所中,仍具备有效的识别性能。
[0035]安全性:呼吸运动具有独特的生物特征信息,作为生物医学信号,具有唯一性,不容易被模仿,采用该信号进行生物特征识别,具有安全可靠性。
[0036]隐私保护性:不收集与用户敏感的图像、声音等人体生理特征相关的数据。在私密等场所的部署中不会涉及个人隐私信息的泄露。
附图说明
[0037]图1为本发明结构和实施例中的一种基于非接触式传感器的身份识别系统的工作流程图;
[0038]图2为本发明实施例中的数据预处理流程图;
[0039]图3为本发明实施例中的基于非接触式传感器的身份识别方法流程图;
具体实施方式
[0040]为使本发明的技术方案便于理解,以下结合附图及实施例,对本法发明进行进一步详细说明。显然,此处所描述的具体实施例仅用以解释本发明的结构和发明点,并不限定于本发明权利要求的限定保护范围。
[0041]本发明实施例提供的基于非接触式传感器的身份识别系统的工作流程如图1所示,整个系统结构上包括非接触式传感器和身份识别系统,对于身份识别系统,包括非接触式传感器接收子系统、生命数据数据库子系统、数据处理子系统、模型训练子系统、身份识别子系统。
[0042]对于非接触式传感器,具体而言,在安装方式上,为保证数据传输的准确性,需要将非接触式传感器安装在能正常识别用户人体生命体征数据的有效范围内。在数据采集上,可以对不同性别、不同年龄段的人群进行数据采集。在数据的传输上,多个非接触式传感器通过以太网,以传输数据报文的方式与身份识别系统间进行监测生命体征数据的传输。
[0043]对于身份识别系统而言,该系统应放置于计算机内,并要求计算机应具备网络通信、数据存储、模型训练的基本功能。
[0044]针对非接触式传感器数据接收子系统,具体而言,内部分为数据接收模块和数据解析模块两个模块。数据接收模块在接收到非接触式传感器发送的数据报文后,交数据解析模块进行处理。
[0045]对于数据接收模块,非接触式传感器数据接收子系统使用UDP协议来进行数据的传输处理操作。开放身份识别系统所处计算机的单一UDP端口并保持监听状态,不断获取非接触式传感器发送的监测用户生命体征的数据报文。
[0046]对于数据解析模块,在数据处理上,第一对数据包正确性进行报头帧校验、数据包长度校验、数据包校验和校验的操作。第二对报文中的生命体征数据进行提取,获取传感器发送的呼吸数据。
[0047]针对生命数据数据库子系统,具体而言,非接触式传感器接收子系统在获取到呼吸数据后,生命数据数据库子系统将数据存储在计算机内部的数据库存储表中,对于监测不同用户的生命体征数据,存储表中应具有唯一标识来对不同用户的身份进行辨别。
[0048]针对数据预处理子系统,针对数据预处理部分具体而言,图2为本发明实施例提供的数据预处理流程图,包括以下步骤:
[0049]步骤S31:获得呼吸生命体征数据;
[0050]步骤S32:进行异常值的处理;
[0051]步骤S33:呼吸片段分割;
[0052]步骤S34:呼吸特征提取;
[0053]步骤S35:二次特征提取;
[0054]步骤S36:获得呼吸特征向量;
[0055]对于步骤S31具体而言,从生命数据数据库子系统存储的计算机内部的数据库存储表中读取用户的呼吸振幅数据来进行后续的数据处理。对于呼吸振幅数据,呼吸振幅数据分为呼吸振幅高值与呼吸振幅低值,而呼吸运动由吸气与呼气两种呼吸运动模式,在选择上,将呼吸振幅低值与呼吸振幅高值选择为一个呼吸区间。其中获得的呼吸振幅数据的单位为mm。
[0056]对于步骤S32具体而言,考虑到监测用户存在暂时离开等情况,这会导致在某段时间内传感器无法获得用户的生命体征数据,针对这种情况,需要对步骤S31中获取到的数据库存储数据进行空值的异常值处理。
[0057]对于步骤S33具体而言,考虑到网络传输异常以及接收数据报文错误可能导致监测对象的结果数量不一致,我们在进行呼吸片段的划分时采用随机截取的方法。对步骤S32异常值处理后的数据,随机截取连续60秒的呼吸数据作为特征提取的基本单位,这种方式能够有效应对数据不一致性的问题。
[0058]对于步骤S34具体而言,从步骤S33获得的呼吸数据中提取出呼吸平均频率、呼吸平均深度、呼吸深度面积、呼吸峰值偏差、呼气平均速度、吸气平均速度、呼气平均间隔时间、吸气平均间隔时间、呼气间隔时间标准差、吸气间隔时间标准差的呼吸特征共10种呼吸特征。各特征变量具体定义如下:
[0059]连续的呼吸振幅中,每一个峰值到下一个谷值表示一个呼气行为,每一个谷值到下一个峰值表示一个吸气行为。一次连续的吸气行为和呼气行为可定义为一次呼吸循环。定义连续的呼吸信号序列为R(t),对第n个呼吸循环定义为Un,其中峰值定义为Pn,波值定义为Vn。
[0060]呼吸平均频率:统计R(t)中呼吸循环的次数并计算给定时间内的呼吸平均频率。
[0061]呼吸平均深度:在一次呼吸循环中,一次呼吸运动的最低值与最高值之间的差值即为呼吸深度,呼吸平均深度可通过统计R(t)中所有最低值与最高值之间的差值来求得。
[0062]呼吸深度面积:需要将原数据序列转为非零数据序列,可以通过计算R(t)与呼吸信号序列最小值Rmin(t)的差值,通过积分的方式来求取呼吸深度面积。
[0063]呼吸峰值偏差:提取所有呼吸循环峰值Pn,然后求得峰值的均值计算每个峰值与均值线之间的偏差,并进行求和,来获得R(t)中的呼吸峰值偏差。
[0064]计算每一个峰值到下一个谷值的一个呼气长度除以呼吸的时间可得到一次呼吸行为的呼气速度,计算每一个谷值到下一个峰值的一个吸气长度除以呼吸的时间可得到一次吸气行为的吸气速度。设定表示呼吸峰值所在呼吸信号序列R(t)中的时刻,表示呼吸谷值所在呼吸信号序列R(t)中的时刻。
[0065]呼气平均速度:
[0066]
[0067]吸气平均速度:
[0068]
[0069]对于呼吸中的呼气与吸气循环来说,峰值到峰值表示一个呼气循环,谷值到谷值表示一个吸气循环。可通过计算每个循环所需要的时间,来求得呼气间隔时间和吸气间隔时间。
[0070]呼气平均间隔时间:
[0071]
[0072]吸气平均间隔时间:
[0073]
[0074]对呼气间隔时间与吸气间隔时间计算标准差。
[0075]呼气间隔时间标准差:
[0076]
[0077]吸气间隔时间标准差:
[0078]
[0079]对于S35具体而言,二次特征提取操作中首先进行特征值的计算,在对呼吸数据进行S34呼吸特征值的提取后,由于提取出呼吸特征值具有不同的量纲,为了降低输入特征值的尺度对模型结果的影响,并同时保留自身的变化趋势,对特征值数据进行特征标准化操作。其次,采用PCA主成分分析方法来进一步发掘呼吸特征值之间的相关关系。PCA主成分分析方法利用基于奇异值分解(SVD)的协方差矩阵,生成了一组新的特征向量。生成的新特征向量之间不存在线性关系,并且发掘了原呼吸特征值中隐藏的相关关系,加强了对对象特征的识别程度。
[0080]对于步骤S36具体而言,在经过步骤S35的二次特征提取后,得到一组适用于模型训练的呼吸特征值序列。
[0081]针对模型训练子系统,具体而言,将数据送入数据预处理子系统得到的呼吸特征值序列送入到随机森林算法训练器中进行训练。
[0082]随机森林算法采用自举聚合的方式,在训练过程中会随机抽样产生多个训练集,并构建多棵分类决策树作为基分类器来进行决策。构建的这些决策树分类器在执行算法时共同参与,最后通过投票的方式决定最终的分类结果。
[0083]在训练数据的长度上,针对每个目标用户,从生命数据数据库子系统中的生命体征数据库存储表中,以每周为单位,随机选择4天进行数据的获取,总计对每个目标用户获取时间长度为30天的数据,送入到上述数据预处理子系统中进行特征的提取。
[0084]在训练数据的处理上,在步骤S32进行异常值处理后,在步骤S33的呼吸数据分割中,对获取的每个用户共随机进行100组60s的呼吸数据分割。然后送入步骤S34、步骤S35进行特征提取。最后获得所有用户的数据片段对应的特征向量交模型进行训练。在训练过程中,使用网格化参数搜索的方法来确定随机森林训练器的参数。通过系统尝试不同的随机森林参数组合,找到最优的参数配置,获得最优的随机森林分类模型的分类效果。最后将训练完成的分类模型送入到身份识别子系统中进行用户身份的识别验证。
[0085]针对身份识别子系统,具体而言,该子系统首先截取呼吸生命数据的片段,并对这些片段进行特征提取处理。处理得到的特征值序列将被送入子系统中预先训练好的分类识别模型中。通过模型的分类结果,与生命数据数据库子系统中的生命体征数据库存储中的身份标识进行比对,进行用户身份的验证。
[0086]图3为本发明实施例提供的基于非接触式传感器的非接触身份识别方法流程图,包括以下步骤:
[0087]步骤S51,获取非接触式传感器的生命体征数据片段;
[0088]步骤S52,呼吸片段特征提取;
[0089]步骤S53,分类模型判断;
[0090]步骤S54,数据库获取身份标识编码序列;
[0091]步骤S55,身份信息的比对验证;
[0092]对于步骤S51具体而言,在进行个人身份识别时,从非接触式传感器数据接收子系统中提取出部分实时的呼吸数据。在提取方式上采用随机截取的方式,对监测到的人体呼吸数据进行10组60s的连续呼吸数据截取。
[0093]对于步骤S52具体而言,对截取的数据片段进行步骤S34中的呼吸特征值的提取,然后进行进一步特征提取处理,首先进行特征标准化,消除不同特征之间的量纲差异。其次利用基于奇异值分解(SVD)的方法,对标准化后的特征值进行处理,得到协方差矩阵。从协方差矩阵中选取特征向量作为新的特征表示,得到新的呼吸特征值向量,最后输入到步骤S53中进行身份的识别验证。
[0094]对于步骤S53具体而言,在步骤S52中获得的呼吸特征值向量输入到身份识别子系统中预先设置的分类识别模型中,分类识别模型在输入呼吸特征值向量后,会输出一个身份标识编号,用于身份信息的比对。
[0095]对于步骤S54具体而言,从生命数据数据库子系统中的生命体征数据库中获取用户身份标识编号序列,参与用户身份信息的识别比对。
[0096]对于步骤S55具体而言,通过将步骤S53中分类器识别模型的输出分类结果与步骤S54中获得的生命体征数据库存储的用户身份标识编号序列进行比对,寻找分类结果得到的身份类别标识与存储在数据库中的标识保持一致的,从而完成对用户身份的识别验证过程。
[0097]以上是本发明的一些具体实施方式,但本发明的保护范围并不局限于上述方式,所有对本发明领域熟悉的工作人员在本发明揭露的技术范围内,对所述的特征及原理进行的各种等效的修改或者替换,这些修改或替换都应涵盖在本发明的保护范围之内。