全国统一服务热线:400-123-4657

站内公告:

诚信为本,市场在变,诚信永远不变...

联系我们CONTACT

地址:江苏省扬州市平果市滨费大楼1122号
传真:+86-123-4567
手机:12509350394
邮箱:admin@youweb.com

400-123-4657

第五系列

当前位置: 首页 > 产品中心 > 第五系列

无论走到哪里机器人都能听懂你的乡音_星空体育全站app

2024-10-23点击量:919

本文摘要:语音辨识是人工智能的一项十分有意思的问题,想想看,人们的语音是多么简单,有所不同国家、民族的人,说道有所不同的国家和民族的语言,有所不同的人,口音不一样,例如中国还有许多方言,语音也不一样。

语音辨识是人工智能的一项十分有意思的问题,想想看,人们的语音是多么简单,有所不同国家、民族的人,说道有所不同的国家和民族的语言,有所不同的人,口音不一样,例如中国还有许多方言,语音也不一样。一个本事大的人,有可能不懂七、八种语言,也能听懂男、女、小孩等等有所不同人、甚至有所不同方言的语言。

但是要设计一个机器人能听懂七八种语言,甚至乡土的方言(例如在民航的接待处服务的机器人),这任务是十分困难的。但是我们可以期望,或许旋即的将来就不会构建。

再说,要在一篇科普文章中说道明语音辨识的技术,也有相当大的可玩性。因为它中用了高等数学中的傅里叶转换的技术。也就是要中用“时域”和“频域”的两个概念,才更容易讲清楚。那么什么是频域、什么是时域?也必须花上点笔墨来讲解。

非常简单地谈,例如50周波的正弦波,在时域的图像上回应是一个倒数上下波动的曲线,如果切换到“频域”,就是在频率轴(横轴)上的50一处一个有幅度的点这不是很非常简单吗!在上一篇“语音合成”一文中,早已讲解了人类语音的一些特征(例如说道声母是相等于高频的噪声、韵母相等于周期反复的非规则波,声调是韵母的声高(频率)有变化的波等等),这是语音的时域形态。我们也说道过,如果用示波器观赏一般人说出的语音波形,是十分复杂,要研究它真是无从下手。但是经傅里叶切换到频域,就找到图形要非常简单得多了,语音波的频率展现出在若干个频率点下有数值。比如男声较低些,女声要低一些。

小孩子的声频更高些。除此之外,在更高的频率域处有数值,那是噪声域,相等于声母的部分,而在较低的频率点上也有一组数值,是韵母域,这些都回应的是有所不同说出人的口腔参数,有所不同人的口型、舌头形状不一样,这两组参数也不一样。所以,在频域分析语音:是声母、韵母、是几声徵、是什么人说道的等等,就更容易多了。

也由此可以想起,人的天赋智能不具备了多么简单的本领,我们的脑子里事前早已存储好了各种模板数据(归属于频域数据,)还包括各个汉字的读音、某些已了解人的声音特征数据,甚至风声、雨声、鸟的鸣叫声等等,因此,人就能判断任何时间听见的声音是什么声音、代表什么文字,这种人所不具备的智能也是几千万年人类演化而来作的。设计机器的语音辨识,先要在计算机里再行存放在好标准的语音参数,称作“模板”(如果要将辨识的语音转换成文字,计算机里也再行存放在好了所有汉字的语音参数(有可能还分男声和女声的数据库,存储的数据是对应某种语音的频域参数,不有可能是时域的波形),这个数据库的创建也可称作机器的训练过程。实际操作语音辨识时,由麦克风读取待辨识的语音,将输出数据再行转换成频域数据,再行和标准数据不作较为,所取参数最相似的作为辨识结果,再行输入,输入的是汉字(或某一国家的文字。

)语音转换成文字还有一个同音字区分的问题,大多数汉语的一个读音对应多个汉字,有的发音对应许多个汉字,甚至上百个汉字(如音节“ji”对应的汉字有100多个)要去辨别某个发音是什么汉字,必需使用上下文的办法,就是看这个读音的前或后追随的是什么汉字(或读音),否能构成词。这些词组都事前在计算机中存好,经由给定对比顺利的词来要求该指定的汉字,有时候不是任何读音都有可能寻找能给定的上下文,就有可能要从语义来辨别。这就更加简单了。

如果要设计的系统是要找寻说出人是谁,而不是关于明确说道的什么,那就只要对比频域参数就可以了。某种程度一句话,有所不同人说道的,波形有所不同,频域中的特征数据也有所不同。平时我们的耳朵征询外界的声音有很强的滤波功能,在噪声相当大的情况下能杂讯噪音,辩见到必须声音(如语音)。

聋人用的助听器,如果意味着是把声波缩放,就不会连同噪声一起缩放,听得一起十分费劲。高级助听器就有杂讯噪音的功能,因而售价就很贵了,因为其中也用了信号处理技术。偷偷地说道一个故事,是解释傅里叶转换、信号处理的本领的。

这是上世纪80年代初,美国麻省理工学院的奥本海姆教授来清华讲学(我曾兼任他的授课翻译成)展示过的一段语音处置的片段:一段帕瓦罗蒂的合唱,有场面可观的乐队演奏,当然很好听得。奥本海姆教授展示用了信号处理技术,居然可以把乐队演奏的声音全部过滤器掉,只只剩了帕瓦罗蒂的唱声,这就可以分开喜爱他的温柔的歌声,这里面中用了简单的滤波技术几乎是傅里叶转换的功劳。(他的歌唱频谱范围和乐队弹奏声音的频谱范围是有所不同的。

将频域里的乐队声的频谱信号移除,再行还原成到时域就只只剩了人的歌唱声了。)可见,信号处理的本领之大了。语音辨识技术经过最近几十年的研究发展,早已十分成熟期,能听得人语音收到命令而行事的机器人本领也越来越大了。

我们清华人在其中不作了贡献,也有一点自豪!。


本文关键词:星空·体育综合APP下载官网,星空体育app下载入口,星空app官网登录,星空体育全站app

本文来源:星空·体育综合APP下载官网-www.108gifts.com