自主可控语音关键事件检测特征

时间：2024年01月30日来源：

上述步骤s302a可以为：步骤s302b：判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像，是否均包含目标对象；如果是，执行上述步骤s303。在本实现方式中，在获取到当前帧图像后，电子设备便可以利用图像识别算法判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像，是否均包含目标对象。其中，当判断结果为是时，电子设备可以确定存在用户进入目标防护舱，则在当前时刻，目标防护舱内可能发生异常事件，这样，电子设备便可以继续执行步骤s303。需要说明的是，在本实现方式中，电子设备可以采用任一能够检测出当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像中是否均包含目标对象的图像识别算法执行上述步骤s302b，对此，本发明实施例不做具体限定。其中，上述预设时长可以为任一时长，例如，2s，5s等，这都是合理的。下面，对电子设备执行上述步骤s302b的具体过程进行说明：电子设备在获取到每帧关于目标防护舱的图像后，判断该图像中是否包含目标对象。进而，在获取该图像的下一帧图像后，判断该下一帧图像中是否包括与前一帧图像相同的目标对象。依次类推。语音关键事件检测在语音识别、语音合成和语音交互等领域具有广泛的应用前景。自主可控语音关键事件检测特征

根据设定的span宽度，对语句进行span划分，以将语句划分为多个span，并对每个span进行标记；其中，每个标记表示x+y+1种类型中的任意一种，1表示所述触发词的类型和所述事件主体的类型以外的其他类型。在本申请的示例性实施例中，所述对所述向量化语义表示w1进行span划分，得到多个语义片段可以包括：获取设定的span的大宽度max_span_width；根据span的宽度从1到max_span_width依次在所述向量化语义表示w1上进行选取，获得多个span的语义表示span_embedding。在本申请的示例性实施例中，所述对所述新的语义表示w3进行span分类可以包括：使用两层全连接神经网络和softmax层对每个span进行分类；其中，在训练阶段，将分类结果与带有标记的span进行误差计算和反向传播。本申请还提供了一种事件检测装置，可以包括处理器和计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令被所述处理器执行时，实现上述任意一项所述的事件检测方法。与相关技术相比，本申请可以包括：获得语句的向量化语义表示w1；对所述向量化语义表示w1进行span划分，得到多个语义片段；对多个语义片段进行平均池化，得到每个span的表示w2。广州自主可控语音关键事件检测供应语音关键事件检测一般应用在什么行业？欢迎来电咨询！

光流图检测模型为：采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型，且每一第二样本图像组中的图像与待分析图像的图像数量相同，各个第二样本图像组中的图像为：关于防护舱的光流图。具体的，当待分析图像为：包括光流图和光流图之前的连续n帧光流图的多张图像，则光流图检测模型为：采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型，且每一第二样本图像组中包括n+1帧光流图。其中，针对至少一个防护舱，在该防护舱中发生各类事件时，获取n+1帧关于该防护舱的光流图，这样，该n+1帧光流图便可以组成一个第二样本图像组，并进一步确定该第二样本图像组的事件检测结果为：获取该n+1帧光流图时，该防护舱内发生的事件类型。具体的，当待分析图像为：光流图，则光流图检测模型为：采用各个第二样本图像和每个第二样本图像的事件检测结果所训练得到的模型，且每个第二样本图像为一帧光流图。其中，针对至少一个防护舱，在该防护舱中发生各类事件时，获取一帧关于该防护舱的光流图，并将获取该光流图时，该防护舱内发生的事件类型作为该光流图的事件检测结果，这样。

光流图检测模型为：采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型，且每一第二样本图像组中包括n+1帧光流图。第二种情况：待分析图像为：当前帧图像和当前帧图像之前的连续m帧图像的多张图像；场景图像检测模型为：采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型，且每一样本图像组中包括m+1帧场景图像；辅助图像为：光流图；光流图检测模型为：采用各个第二样本图像和每个第二样本图像的事件检测结果所训练得到的模型，且每个第二样本图像为一帧光流图。第三种情况：待分析图像为：当前帧图像；场景图像检测模型为：采用各个样本图像和每个样本图像的事件检测结果所训练得到的模型，且每个样本图像为一帧场景图像；辅助图像为：包括光流图和光流图之前的连续n帧光流图的多张图像；光流图检测模型为：采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型，且每一第二样本图像组中包括n+1帧光流图。第四种情况：待分析图像为：当前帧图像；场景图像检测模型为：采用各个样本图像和每个样本图像的事件检测结果所训练得到的模型，且每个样本图像为一帧场景图像；辅助图像为：光流图。在语音合成中，语音关键事件检测可以用于提取和合成特定情感或风格的语音片段。

本发明实施例提供的一种事件检测方法可以引用于任一能够利用模型进行图像检测的电子设备，例如，平板电脑、笔记本电脑、台式电脑等，这都是合理的。为了描述方便，以下简称电子设备。需要说明的是，当前存在多台投入使用的防护舱，而针对每台防护舱都可以采用本发明实施例提供的一种事件检测方法来对关于该防护舱的事件进行检测。其中，每台电子设备可以只针对一台防护舱，检测关于该防护舱的事件；也可以针对多台防护舱，分别检测关于该多台防护舱的事件。这都是合理的。具体的，当一台电子设备针对多台防护舱，分别检测关于该多台防护舱的事件时，可以为每台防护舱添加标签，进而，确定的每台防护舱对应的待分析图像中也会携带有该防护舱的标签。这样，电子设备便可以区分每台防护舱对应的待分析图像，进而，确定关于每台防护舱的事件检测结果。其中，每台防护舱都是该电子设备对应的目标防护舱。而针对每台防护舱，电子设备均采用本发明实施例提供的事件检测方法对关于该防护舱的事件进行检测。为了便于理解，图3所示的流程图，便是从电子设备对关于一台目标防护舱的事件进行检测的角度，对本发明实施例的一种事件检测方法进行说明。如图3所示。智能语音质检都有什么功能?欢迎来电咨询！上海数字语音关键事件检测服务标准

语音关键事件检测算法通常基于机器学习和深度学习技术，通过训练模型来识别不同的声音模式。自主可控语音关键事件检测特征

如果是，基于所述当前帧图像，确定待分析图像，其中，所述待分析图像为：关于所述目标语音关键事件检测防护舱及所述目标对象的图像；将所述待分析图像输入到预设的检测模型中，得到关于所述目标防护舱的事件检测结果；其中，所述检测模型为：基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。第二方面，本发明实施例提供了一种事件检测装置，所述装置包括：图像获取模块，用于实时获取关于目标防护舱的图像，并将当前时刻所采集到的图像作为当前帧图像；图像检测模块，用于检测所述当前帧图像是否包含目标对象，其中，所述目标对象为：能够表征用户进入所述目标防护舱的用户身体部位；如果是，触发图像确定模块；所述图像确定模块，用于基于所述当前帧图像，确定待分析图像，其中，所述待分析图像为：关于所述目标防护舱及所述目标对象的图像；结果确定模块，用于将所述待分析图像输入到预设的检测模型中，得到关于所述目标防护舱的事件检测结果；其中，所述检测模型为：基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。第三方面，本发明实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口。自主可控语音关键事件检测特征

上一篇：山东无限语音关键事件检测是什么

下一篇：北京光纤数据语音关键事件检测介绍