日期:2014-04-18  浏览次数:20998 次

 

随着XML在工业界被广泛的采用,在不同的领域不同的行业,各自派生出了一些在一些特定领域适用的XML子集。在这一系列文章中将要次要引见的VoiceXML就是其中之一。它和WML的地位非常类似。WML是使用于无线上网中的特种言语,VoiceXML是使用于语音浏览的特种言语。无线上网(WAP)和语音浏览是如今网络发展的两大热点,XML在它们身上都找到了用武之地。

整篇文章将比较引见XML在语音中使用的一些重要环节。除了VoiceXML之外,还会引见一些XML在语音技术中使用的其他方面。在这一部分中次要是背景知识的引见。

语音浏览器,VoiceXML诞生的温床

电话的出现是为了方便通信。电脑的出现是为了计算。进入“后PC时代之”后,“电脑”同“网络”这两个词越来越靠近。如今,很多买电脑的人得以达目的就是为了上网。网络成了信息交换共享的一条捷径,人们纷纷“中弹落马”。以致于通过电话上网也提上了日程。越是简单通用的,就越是遭到最广泛普通消费者的青睐。越是遭到最广泛普通消费者的青睐的就越是被工业界大力推崇。

有一点是毫无疑问的,那就是如今的电话比电脑要多。随便走在一个城市的街道上,您会很轻易地发现公用电话。但我如今还不敢想象在大街上随处可见的“公用电脑亭”,五角钱三分钟上网。不光是在城市,电话并不是什么稀罕玩艺,而要买一台电脑,不少人还是要咬一咬牙。而且,电话比电脑的这种优势还在不断扩大。团体挪动电话的发展正处于史无前例的高峰时期,置信将来的单人对单机并不是什么神话。

另外,电话远比电脑具有亲和力。我置信许多人对电脑的操作都具有一定工具心思。不是怕原有的界面被改动后无法还原,就是怕不知道应该在哪里去修正想要的设置。这对曾经是比较敌对的视窗界面就是如此了,更不要去说什么满屏黑的Unix之类。而电话就不一样了,只要非常无限的几个键,遇到麻烦把话筒一挂再重新拿起就是了。而且关键的是电话听筒里说的是“人话”。

所以我们说通过电话访问网络是非常有前途的。再加上如今还有一种发展趋势就是把多种界面访问方式,比如是语音、图像和触觉等,一同结合在电话上成为名副其实的PDA(团体数字助理),我们不得不在这里再一次对电话的发展前途夸耀一番。人们将可以在任何时间任何地点通过随手可得的“电话”,通过简单易懂的操作方法连接到网络。

语音浏览是网络的一种全新浏览方式

对于一家小有规模的公司来说,拥有一台电话总机并不是一件什么新颖事。电话用户可以通过数字按键联络到不同的员工。还有一种普遍的电话总机功用是用或通过数字按键游离层状目录结构来获取信息。而我们要在这里探讨的语音浏览和这里的方式上有类似之处。用户主要是通过语音来发送本人的信息。我们还可以把服务的对象扩大到提供内容服务的网站上去。使用的联络网络也不一定要是公用电话网,还可以是因网。

什么是语音浏览器

语音浏览器是以语音输入为次要输入渠道,其他方式为辅助输入渠道,翻译解释执行语音标记言语,并能产生语音输出的设备。

上面这段味如嚼蜡的解释源于W3C。就像要用一句话把人描述出来一样,它颇费周折地概述了一些空泛的特性。双腿直立行走,用上肢劳动的哺乳类动物云云。语音浏览器想要实现的是通过最具有亲和力的交流方式,把来自具有最丰富资源的网络上的信息通过声音提供应用户。

明眼人一看便知,设计完成一个语音浏览器还有语音识别、语音理解和语音合成上的技术壁垒。当用户要通过语音发出命令时,语音浏览器要知道用户在说些什么?比较简单的是命令式语音识别。系统要求你只能说“蚊子”或是“苍蝇”。其他的都认为是非法输入。复杂的要牵涉到对一段语音的理解。比如说当用户说“今天星期几?”或是“今天是一个星期中的第几天?”时要知道是同一回事。这样的话,用户就方便了不少。而这就需求语音理解技术来处理了。语音合成也是必不可少的。当你要把浏览到的信息传送给用户时时通过语音。这可以是一段事先录好的自然人语音,也可以是通过文字到语音的TTS语音合成系统。可以非常明确的说,上面要用到的技术都是需求大量的技术积累才能实现的,绝不是一日之功。对于绝大多数设计实现语音浏览器的开发上来说都会很自然的去采用一些在语音方面颇有底蕴的公司所提供的技术产品支持。次要的精力都在集成之上。