基于语音识别技术的声控鼠标光标程序设计

摘要:实现了一种基于语音识别技术的声控鼠标光标应用程序。

它可以使用语音来控制鼠标光标移动到屏幕上的任何位置。

它可以帮助残障人士仅在没有鼠标和键盘的情况下使用语音操作计算机。

分析了使用声控鼠标光标的延迟缺陷,并进行了有针对性的改进。

1概述经过多年的发展,计算机语音技术取得了长足的进步。

当前,已经有一些产品和项目使人们有机会与计算机进行交互。

例如,IBM的Viavoice系列软件和Microsoft的新Office产品都是实用的。

语音功能可以执行诸如语音命令和文本输入之类的任务,并且还出现了一些基于语音技术的应用系统。

语音技术的发展,尤其是语音识别技术,使人们可以用语音控制计算机。

对于世界上许多无法轻松使用传统鼠标和键盘的残疾人来说,这具有重要意义。

另外,在某些情况下操作计算机是不方便的。

这在必须使用它的情况下也很有意义,例如在驾驶时查询电子地图。

当前,如果要真正使用图形界面控制计算机,则必须像使用键盘和鼠标一样使用语音控制来输入数据并控制光标。

因此,有效的语音控制游标程序,即可以放置在屏幕上任何位置并可以模拟各种鼠标动作(例如单击,双击,拖动等)的语音控制程序,对于实现语音控制计算机的工具。

本文使用免费的语音识别引擎和Microsoft Speech SDK 5.1的模拟鼠标技术在Delphi7.0中实现语音控制的鼠标应用程序,该应用程序可以实现语音控制的鼠标移动,停止,单击和其他操作来控制屏幕光标。

分析了语音控制鼠标程序中的延迟问题,提出并实现了一种改进方法。

2基于语音识别的光标控制的类型当前,鼠标的语音控制有两种模式:一种是面向目标的光标控制和面向方向的光标控制[n]。

对于前者,用户需要使用语音来给出特定的目标名称或位置,例如图标,菜单或屏幕区域名称,然后给出执行的命令,例如“单击”等。

这种方法仍然有效对于单个软件。

但是当目标增加时,用户需要记住许多目标的名称,并且可能存在具有相同名称的目标,因此工作中的错误率会增加。

另一种方向游标控制分为两种:不连续控制和连续控制。

对于不连续的情况,用户应同时说明方向和距离。

例如,命令“向左8cm”,则光标将向左移动8cm。

;对于连续的情况,用户首先解释诸如“左”的方向,光标向左移动,并且光标停止移动,直到用户说“停止”为止。

再次。

本文讨论的声控光标属于方向方向上的连续控件。

这种鼠标控件更符合日常使用习惯,并且用户更适应使用。

3实现本文中语音控制光标程序的语音控制采用Microsoft Speech SDK 5.1的语音识别引擎及其API接口。

这是一个免费的开发工具包,可用于开发具有中文语音功能的软件。

语音识别引擎通常可以分为两种工作模式,一种是命令和控制模式,在这种模式下,语音识别引擎可以识别简短的语音命令以执行相应的程序。

另一个是连续听写模式。

在这种模式下,语音识别引擎需要识别连续语音。

与语音控制相比,此功能的实现更为复杂,因为在语音听写过程中需要分析和判断相同相似发音的上下文和单词,并且命令控制语音模式在此过程中不需要上下文分析。

本文采用命令控制方法,因为语音控制鼠标的实现仅需要识别一些短命令,例如“左”,“右”,“停止”。

rdquo;等等。

图1是语音控制鼠标程序的结构图。

图1语音控制鼠标程序结构应用程序主要包括两部分:第一部分是主要程序。

联系方式

ARF系列片式电阻器设计为低内部电抗。薄膜技术应用于电阻器是适当的,以减少寄生电感和电容。 低内部电抗允许这些器件在高频下保持非常好的电阻器行为。

查看详情

在线咨询