北京光纤数据语音关键事件检测介绍

时间：2024年01月30日来源：

确定在时刻t0目标人物所处的位置信息，以及在时刻t1目标人物所处的位置信息。根据两个时刻目标人物所处的位置信息，可以获取目标人物的运动轨迹。根据目标人物的运动轨迹，可以获知目标人物所处的理论位置范围。在确定了目标人物的理论位置范围之后，控制器12可以从m个第二摄像头14采集到的实时图像中，识别出目标人物游泳时的动作姿势，进而获取目标人物的泳姿信息。在实际应用中，游泳者在游泳时，其对应的泳姿可以为蝶泳、蛙泳、仰泳、自由泳等。无论哪种泳姿，都存在一定的规律性。在具体实施中，控制器12可以采用现有的图像识别方法来识别目标人物游泳时的动作姿势。控制器12可以将识别出的动作姿势与现有的泳姿信息库进行比对，从而获知目标人物的泳姿信息。具体的比对过程也可以采用现有的匹配算法，本实用新型实施例不做赘述。在具体实施中，可以预先根据经验值，设置相应的目标频率值。例如，根据大数据统计分析，正常情况下，游泳者沉浮一次间隔的时间为15s，也即1分钟游泳者的沉浮频率为4次。此时，可以设置目标频率值为1分钟4次。可以理解的是，目标频率值也可以根据实际的应用场景进行设定，并不仅限于本实用新型上述实施例中提供的示例。在智能家居系统中，语音关键事件检测可以实现通过语音指令控制家电设备的开关和功能。北京光纤数据语音关键事件检测介绍

在本申请的示例性实施例中，在通过双向lstm网络获得语句的向量化语义表示w1之前，所述方法还可以包括：将语句中的m个字符随机初始化为一个维度为[m，n]的n维向量d，其中，对于从0到m-1的索引id，每个id对应一个不同的字符；对于长度为s的语句，该语句中每一个字符能够在向量d中找到对应的id，从而获得维度为[s，d]的向量。在本申请的示例性实施例中，通过双向lstm网络获得语句的向量化语义表示w1可以包括：将维度为[s，d]的向量输入预设的双向lstm神经网络，将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中，通过bert模型获得语句的向量化语义表示w1可以包括：将语句直接输入所述bert模型，将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中，所述向量化语义表示w1的维度可以为[s，d1]；其中，当通过双向lstm网络获得语句的向量化语义表示w1时，d1为2*lstm隐层节点数；当通过bert模型获得语句的向量化语义表示w1时，d1＝768。在本申请的示例性实施例中，所述方法还可以包括：预先将触发词的类型划分为x种，将事件主体的类型划分为y种，其中，x、y均为正整数；在获得语句的向量化语义表示w1之前。广东信息化语音关键事件检测特征语音关键事件检测找鱼亮科技！

直至电子设备判断预设时长内采集到的连续多帧图像中均包含相同的目标对象后，电子设备继续获得下一帧图像，即预设时长后的当前时刻对应的当前帧图像，并判断该当前帧图像中是否包括预设时长内采集到的连续多帧图像所包含的目标对象。这样，当判断结果为是时，电子设备便可以继续执行后续步骤s303。当前，光流法是图像分析领域中被重点关注的一种方法，所谓光流是指图像亮度模式的表观运动。可以理解的，当用户在防护舱中进行各类金融活动时，用户的某些身体部位也是运动的，例如，手指等。光流表达了图像的变化，可以引申出光流场。所谓光流场是指图像中所有像素点构成的一种二维(2d)瞬时速度场，其中的二维速度矢量是景物中可见点的三维速度矢量在成像表面的投影。这样，光流不包含了被观察物体的运动信息，而且还包含有关景物三维结构的丰富信息。因此，在本发明实施例中也可以引入光流法。可选的，一种具体实现方式中，上述本发明实施例提供的一种事件检测方法中，还可以包括如下步骤d1：步骤d1：每当获取到一帧图像时，利用该帧图像和该帧图像的前一帧图像，得到该帧图像对应的光流图；由于光流包含被观察物体的运动信息，因此，光流图表征的是两帧图像之间的变化。

本发明实施例提供的一种事件检测方法，包括如下步骤：s300：实时获取关于目标防护舱的图像，并将当前时刻所采集到的图像作为当前帧图像；其中，目标防护舱指代的是需要进行事件检测的防护舱，并不具有任何其他限定意义。目标防护舱所对应的目标图像采集设备，实时对目标防护舱的内部空间进行图像采集，并将得到的关于目标防护舱的图像实时传输给的目标防护舱所对应的电子设备。这样，电子设备便可以实时获取关于目标防护舱的图像。其中，可以理解的，关于目标防护舱的图像可以为目标防护舱内部空间的图像。也就是说，上述目标图像采集设备可以在每个时刻采集关于目标防护舱的图像，进而，电子设备可以在每个时刻获得在该时刻时，关于目标防护舱的图像，该图像显示了每个时刻目标防护舱的内容空间的情况。则在当前时刻，电子设备所获得的关于目标防护舱的图像即为在当前时刻，目标图像采集设备所采集的关于目标防护舱的图像，这样，电子设备可以将该图像作为当前帧图像。显然，电子设备可以基于当前帧时刻，确定当前时刻，关于目标防护舱的事件检测结果。s301：检测当前帧图像是否包含目标对象，如果是，执行步骤s303；其中。语音关键事件检测在线咨询鱼亮科技！欢迎来电咨询！

比如人名、地名、组织机构名、时间等。4、事件检测与主体抽取：事件检测与主体抽取即为同时抽取事件的触发词和事件的主体。5、注意力机制：注意力机制的本质来自于人类视觉注意力机制。当人们发现一个场景经常在某部分出现自己想观察的东西时，人们会进行学习在将来再出现类似场景时把注意力放到该部分上。在计算某一序列表示时，注意力机制可以获得权重和序列位置的相关性。6、自注意力机制：自注意力机制是对注意力机制的改进，减少了对外部信息的依赖，更擅长捕捉数据或特征的内部相关性，无视词之间的距离直接计算依赖关系，能够学习一个句子的内部结构。7、span：span可认为是“一段区域，每个span具有一定的宽度”，就是对一段话进行固定长度的选取，比如一句话“我吃了面包，喝了牛奶”，如果span的宽度为2，则可以得到片段“我今”、“”、“天吃”等。8、span的划分：span的划分是指根据设定的span的大宽度，从小到大依次进行划分。比如span大宽度为8，则span的宽度为1-8，分别进行划分，可以得到多个span。9、span的分类：span的分类是指通过模型或特定的方法判断一条数据所属的类型即标签，一般而言，分类任务中的每条数据只属于一个类别。语音关键事件检测和摄像头有联系吗?湖北数字语音关键事件检测哪里买

语音关键事件检测算法通常基于机器学习和深度学习技术，通过训练模型来识别不同的声音模式。北京光纤数据语音关键事件检测介绍

并判断当前时刻所采集到的当前帧图像是否包括目标对象，由于目标对象为：能够表征用户进入目标防护舱的用户身体部位，则可以基于当前帧图像判断当前时刻是否有用户进入目标防护舱。则当判断结果为是时，便可以基于当前帧图像，确定待分析图像，进而将该待分析图像输入到预设的检测模型中，得到当前时刻，关于目标防护舱的事件检测结果。这样，由于检测模型是基于各个样本图像和各个样本图像的事件检测结果所训练得到的模型，因此，检测模型充分学习了样本图像和事件检测结果之间的对应关系。基于此，在本发明实施例中，利用采集到的真实图像来确定待分析图像，利用训练好的检测模型对待分析图像进行检测，便可以提高关于目标防护舱的事件检测结果的准确率。而上述事件检测结果中可以包括目标防护舱内所发生的事件类型，从而可以提高对防护舱内用户出现异常事件的检测准确率。需要说明的是，由于电子设备可以实时对目标防护舱内部发生的异常事件进行检测，则在上述本发明实施例提供的一种事件检测方法中，电子设备对实时获取的每一关于目标防护舱的图像后，判断该图像是否包括目标对象，并在判断结果为是时，执行后续步骤s303-s304。然而，可以理解的，在某些时刻。北京光纤数据语音关键事件检测介绍

上一篇：自主可控语音关键事件检测特征

下一篇：重庆新一代语音关键事件检测哪里买