广西电子类语音关键事件检测特征

时间:2021年09月06日 来源:

    实施例一:待分析图像为上述类图像,即待分析图像为至少包含当前帧图像的目标防护舱的图像:则上述步骤s304,包括如下步骤f1-f2:步骤f1:将待分析图像输入到预设的场景图像检测模型中,得到场景图像检测模型输出的检测结果;步骤f2:基于场景图像检测模型输出的检测结果,确定关于目标防护舱的事件检测结果;其中,由于待分析图像为目标防护舱的场景图像,则在本实施例一中,所采用的检测模型即为预设的场景图像检测模型,且用于训练该场景图像检测模型的各个样本图像组中所包括的图像可以称为场景图像。需要说明的是,场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中的图像与待分析图像的图像数量相同,各个样本图像组中的图像为:所采集到的关于防护舱的图像。具体的,当待分析图像为:当前帧图像和当前帧图像之前的连续m帧图像的多张图像,则场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中包括m+1帧场景图像。其中,针对至少一个防护舱,在该防护舱中发生各类事件时,采集m+1帧关于该防护舱的图像,这样。语音关键事件检测的运用多吗?广西电子类语音关键事件检测特征

广西电子类语音关键事件检测特征,语音关键事件检测

    确定当前时刻,关于目标防护舱的事件检测结果。需要说明的是,电子设备可以通过多种方式执行上述步骤f23,对此本发实施例不作具体限定。为了行文清晰,后续对上述步骤f23的具体实现方式进行举例说明。显然,在本实施例三中,采用多种数据来确定检测关于目标防护舱的事件检测结果,使得到的事件检测结果更可靠,且具有说服力,从而可以提高对防护舱内用户出现异常事件的检测准确率。其中,由于类图像可能为:当前帧图像和当前帧图像之前的连续m帧图像的多张图像,也可能为:当前帧图像;第二类图像可能为:包括光流图和光流图之前的连续n帧光流图的多张图像,也可能为:光流图。因此,在本实施例三中,待分析图像和辅助图像,以及分别对应的场景图像检测模型和光流图检测模型,也可能存在多种情况。具体的:种情况:待分析图像为:当前帧图像和当前帧图像之前的连续m帧图像的多张图像;场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中包括m+1帧场景图像;辅助图像为:包括光流图和光流图之前的连续n帧光流图的多张图像。海南量子语音关键事件检测标准语音关键事件检测该如何使用?

广西电子类语音关键事件检测特征,语音关键事件检测

    直至电子设备判断预设时长内采集到的连续多帧图像中均包含相同的目标对象后,电子设备继续获得下一帧图像,即预设时长后的当前时刻对应的当前帧图像,并判断该当前帧图像中是否包括预设时长内采集到的连续多帧图像所包含的目标对象。这样,当判断结果为是时,电子设备便可以继续执行后续步骤s303。当前,光流法是图像分析领域中被重点关注的一种方法,所谓光流是指图像亮度模式的表观运动。可以理解的,当用户在防护舱中进行各类金融活动时,用户的某些身体部位也是运动的,例如,手指等。光流表达了图像的变化,可以引申出光流场。所谓光流场是指图像中所有像素点构成的一种二维(2d)瞬时速度场,其中的二维速度矢量是景物中可见点的三维速度矢量在成像表面的投影。这样,光流不包含了被观察物体的运动信息,而且还包含有关景物三维结构的丰富信息。因此,在本发明实施例中也可以引入光流法。可选的,一种具体实现方式中,上述本发明实施例提供的一种事件检测方法中,还可以包括如下步骤d1:步骤d1:每当获取到一帧图像时,利用该帧图像和该帧图像的前一帧图像,得到该帧图像对应的光流图;由于光流包含被观察物体的运动信息,因此,光流图表征的是两帧图像之间的变化。

    在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,通过bert模型获得语句的向量化语义表示w1可以包括:将语句直接输入所述bert模型,将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,所述向量化语义表示w1的维度可以为[s,d1];其中,当通过双向lstm网络获得语句的向量化语义表示w1时,d1为2*lstm隐层节点数;当通过bert模型获得语句的向量化语义表示w1时,d1=768。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前。语音关键事件检测是高科技吗?

广西电子类语音关键事件检测特征,语音关键事件检测

    也就是说,安装在防护舱内的用于监控防护舱内情况的摄像头,可以作为本发明实施例中关于防护舱的图像的数据来源。这样,可以通过一个设备实现多种功能,可以极大地节省成本。当然,也可以在防护舱的相关位置上安装专门用于实时采集关于防护舱的图像的图像采集设备。这都是合理的。其中,为了获得较高的关于目标防护舱的事件检测结果的准确率,人们希望所获得的关于防护舱的图像能够尽可能的包括防护舱内更多的区域,即人们希望图像采集设备的拍摄区域能够尽可能地覆盖到防护舱内更多的空间。例如,如图2所示,可以将安装在防护舱顶部的摄像头作为本发明实施例中关于防护舱的图像的数据来源。其中,摄像机的镜头可以垂直于舱顶,也可以倾斜于舱顶,与舱顶形成一定的角度,例如,不小于60度。这都是合理的。当然,在实际应用中,作为关于防护舱的图像的数据来源的图像采集设备也可以安装在其他位置,只要能够保证能够基于该图像采集设备所采集到的关于防护舱的图像,确定当前时刻,关于目标防护舱的事件检测结果即可。下面,对本发明实施例提供的一种事件检测方法,进行介绍。图3为本发明实施例提供的一种事件检测方法的流程示意图。需要说明的是。语音关键事件检测的成熟度如何?海南量子语音关键事件检测标准

语音关键事件检测的社会的作用有哪些?广西电子类语音关键事件检测特征

    比如人名、地名、组织机构名、时间等。4、事件检测与主体抽取:事件检测与主体抽取即为同时抽取事件的触发词和事件的主体。5、注意力机制:注意力机制的本质来自于人类视觉注意力机制。当人们发现一个场景经常在某部分出现自己想观察的东西时,人们会进行学习在将来再出现类似场景时把注意力放到该部分上。在计算某一序列表示时,注意力机制可以获得权重和序列位置的相关性。6、自注意力机制:自注意力机制是对注意力机制的改进,减少了对外部信息的依赖,更擅长捕捉数据或特征的内部相关性,无视词之间的距离直接计算依赖关系,能够学习一个句子的内部结构。7、span:span可认为是“一段区域,每个span具有一定的宽度”,就是对一段话进行固定长度的选取,比如一句话“我吃了面包,喝了牛奶”,如果span的宽度为2,则可以得到片段“我今”、“”、“天吃”等。8、span的划分:span的划分是指根据设定的span的大宽度,从小到大依次进行划分。比如span大宽度为8,则span的宽度为1-8,分别进行划分,可以得到多个span。9、span的分类:span的分类是指通过模型或特定的方法判断一条数据所属的类型即标签,一般而言,分类任务中的每条数据只属于一个类别。广西电子类语音关键事件检测特征

深圳鱼亮科技有限公司一直专注于语音识别,音效算法,降噪算法,机器人,智能玩具,软件服务,教育培训,芯片开发,电脑,笔记本,手机,耳机,智能穿戴,进出口服务,云计算,计算机服务,软件开发,底层技术开发,软件服务进出口,品牌代理服务。,是一家通信产品的企业,拥有自己**的技术体系。目前我公司在职员工以90后为主,是一个有活力有能力有创新精神的团队。诚实、守信是对企业的经营要求,也是我们做人的基本准则。公司致力于打造***的智能家居,语音识别算法,机器人交互系统,降噪。公司凭着雄厚的技术力量、饱满的工作态度、扎实的工作作风、良好的职业道德,树立了良好的智能家居,语音识别算法,机器人交互系统,降噪形象,赢得了社会各界的信任和认可。

信息来源于互联网 本站不为信息真实性负责