1. 声音美感如何评价
声音的美感可以用音乐性和令人享受来评价。
一方面声音可以表露人心,可以判断出其对待事情的态度和情绪,当然聪明点的可以完美的利用声音表里不一。声音本身是具有音乐性的,音乐如同滋味,声音悦耳产生美感,带来不同的情感体验,甚至引起联想。
声音美感建立在心理之上,但与生理快感也不无联系。就好像碰到对口的音乐或DJ你就会不断的听,好声音会让人觉得TA很可靠人很好很性感。
2. 声学相关的。请问在混响和噪声环境中的语音清晰度主观和客观的评价方法都有哪些比如(PESQ)
声学处理的内容
隔音处理
集体教学中,教室的隔音处理主要是通过一些措施来应对教室周围环境噪声的干扰。尤其是当教室位于比较繁华的地段、教室外面进行一些比较吵闹的课外活动时,这些噪声会传入室内,影响学生对声音的接收程度。这种情况下,一定程度的隔声处理是非常必要的。
但是,在教学环境中强调的隔声处理和临床研究中所要求的全封闭的隔声处理是有一定区别的,它在进行隔声处理的基础上还要求教室有一定的通透性,以保证孩子能够在一个相对舒适的环境中学习。
混响处理
混响是指由于反射的存在,当声源停止作用后,声波仍可持续一段时间的现象。只要有空间和障碍物存在的地方就会产生混响。在教室内,老师发出的声音信号经过墙壁的反射会形成重叠,混响越严重,声音信号重叠就越多,学生对声音的辨别就越困难。
因为混响和教室周围环境没有关系,所以即便教室周围环境很安静,它对教学实施的影响依然存在。相对于正常人而言,听障儿童对混响的抵抗能力是非常弱的,声音信号的叠加会造成他们分辨上的困难,从而影响其对声音的收听和理解。所以说混响处理是教室声学环境处理十分重要的一个方面。
那么,怎样衡量混响处理是否达到恰当的水平呢?王博士提到了一个概念—“混响时间”,它是声源停止作用后,声压级比原始强度降低60dB所用时间。一般教室混响时间不能超过0.5秒。混响时间过长,会使声音含混不清;混响时间过短,声音发干,枯燥无味,不亲切自然;所以,只有当混响时间合适时声音才会圆润动听,对孩子的影响才会最小。
声场均匀度
当教室的声场不均匀时,相邻区域的声音强度会有较大不同。这样,会造成在某一座位的同学听得声音大,而在旁边座位的同学听得声音小的现象;如果在课堂上学生的头动来动去,还会感觉声音一会大一会小。对于集体教室教学而言,声场不均匀会严重影响学生对声音的收听和理解。
王博士指出,一般涉及到教室声学环境创设时不会经常提到声场均匀度这一概念,但是注意到这一点对于听障儿童集体教学而言却是十分重要的。它的处理方法也很简单,只需要对教室环境做一些细微的改变就能实现。
声学处理的方法
在王博士看来,影响声学处理的最主要因素是人们对这一问题的认识程度而不是经济问题,以上提到的声学处理,往往只需要一些简单的方法就能达到很好的效果。
隔音:窗户可以做成双层的,左右两扇窗户的衔接处要有密封条,因为声音会通过缝隙进入室内;门要进行软包处理,这样不仅可以达到隔音的效果还可以减少噪音,开关时噪音不会大;墙体要加厚。
混响处理:相较于硬的材料,软的材料更容易降低声音的反射程度,减轻混响的影响。因此,为了降低混响的影响,墙壁一般附上一层木板或者进行软包处理。最简单的软包处理方法一般是在墙壁上包一层海绵,外表附上一层布,既能起到降低混响的作用,又可以装饰墙面。
屋顶装修的时候可以选择吸音顶,它的造价和一般的吊顶相当,但是表面的小孔却可以起到减少声音反射的作用。地面则可以选择铺一层地毯。
注意:因为集体教室是和孩子活动密切相关的环境,所以这些材料的选择都要保证卫生和安全。
声场均匀度:可以在装修时,细微地改变墙面的长度和宽度,使之成为一个相对不规则的空间,这样声音反射的规律就会被打破,不会出现声音强度在不同区域过高或过低的状况,声场内各点的声音强度就会变得相对均匀。因为是教学环境,进行声学处理后,教室的声音环境只要达到安静会议室的水平就可以,一般是小于或等于50dB(A)。
无庸置疑,声音质量高低对于听障儿童康复而言具有十分重要的影响。通过王博士的讲解我们可以发现,简单的声学处理是可以为孩子创造一个更有利于其接收和学习语言的环境的。相信随着人们认识水平的提升,当前集体教学中面临的一些声音问题会得到有效解决。
注释:信噪比又称为讯噪比,是信号的有用成份与杂音的强弱对比,常用分贝数(dB)表示。信噪比越高表明杂音越少。
Tips
误区:没有进行声学处理的环境相当于在自然环境中教学,更利于孩子的发展。
这一认识是不正确的。
对于听力有残疾的孩子而言,他们更容易受声音环境的影响,对声音有更高的要求。如果教学环境没有进行声学处理,孩子容易受噪音和混响的干扰,影响其对声音的接收,导致学习效果下降。
如果需要模拟自然环境进行教学,老师可以在教学过程中根据孩子的发展程度混入一些人为制造的噪音,以控制信噪比,因为容易控制的环境更有利于教学的实施,这样既保证了孩子对信息接收也锻炼了孩子的听觉能力。
听觉语言学习是一个循序渐进的过程,对于刚刚进行康复训练的孩子,要保证其在一个安静的声学环境中进行教学,然后随着孩子能力的提升,逐渐过渡到自然环境中学习。这个过程对于听障儿童自信心的树立也是十分重要的。
3. 怎样评价一个人嗓音条件的好坏
这个很难评价的.
凭你的感觉吧.
还有他的音色.
然后音域的宽广程度
4. 人的嗓音可以改变的嘛
可以的。
嗓音,指人自然发出的声音,包括哭、笑、打喷嚏等,属于乐音。
嗓音,之人自然发出的声音,包括哭、笑、打喷嚏等,属于乐音。
嗓音,说话歌唱的声音。嗓,嗓子,特指人的喉咙。其它动物的发声器官不叫嗓子,它们鸣叫声音也不叫嗓音如:嗓音圆润 嗓音细哑。
吸烟危害嗓音的客观观察
目的:为客观、定量评估吸烟对嗓音的危害。
方法: 利用Dr Speech Science for Windows软件分别测试90例不吸烟和吸烟者的嗓音。
结果 :振幅微扰(Jitter)、基频微扰(Shimmer)和声门噪声值(NNE)在吸烟人群中明显高于不吸烟者,且随烟龄的增加而增高。
结论: 吸烟降低嗓音音质;计算机嗓音测试为临床嗓音的定量评估提供了客观内容。
5. 声音的质量从声音和信号的频率范围上可分几类
根据声音的频带,通常把声音的质量分成5个等级,由低到高分别是电话(telephone)、调幅(amplitude molation,AM)广播、调频(frequency molation,FM)广播、激光唱盘(CD-Audio)和数字录音带(digital audio tape,DAT)的声音。在这5个等级中,使用的采样频率、样本精度、通道数和数据率列于表2–01。
http://www.dxrtvu.net/wlkj/dmtzzsyrj-xwd/mxzy/MultiMedia/multimedia/course/course/course1-2-2.html
声音质量的评价是一个很困难的问题,目前还在继续研究的课题。前面介绍了用声音信号的带宽来衡量声音的质量,等级由高到低依次是DAT,CD,FM,AM和数字电话。此外,声音质量的度量还有两种基本的方法:一种是客观质量度量,另一种是主观质量度量。评价语音质量时,有时同时采取两种方法评估,有时以主观质量度量为主。
声音客观质量的度量主要用信噪比(signal to niose ratio,SNR),详细计算可参看[2][3]。
与用SNR客观质量度量相比较,应该可以说人的感觉(如听觉、视觉等)更具有决定意义,感觉上的、主观上的测试应该成为评价声音质量和图像质量不可缺少的部分。而有的学者则认为,在语音和图像信号编码中使用主观质量度量比使用客观质量度量更加恰当,更有意义。可是一般来说,可靠的主观度量值也是比较难获得的,所获得的值也是一个相对值。
主观度量声音质量的方法类似于电视节目中的歌手比赛,由评委对每个歌手的表现进行评分,然后求出平均值。对声音质量的度量也可以使用类似的方法,召集若干实验者,由他们对声音质量的好坏进行评分,求出平均值作为对声音质量的评价。这种方法称为主观平均判分法,所得的分数称为主观平均(mean opinion score,MOS)分。
现在,对声音主观质量度量比较通用的标准是5分制,各档次的评分标准见表2-03。
http://www.dxrtvu.net/wlkj/dmtzzsyrj-xwd/mxzy/MultiMedia/multimedia/course/course/course1-2-5.html
6. 按音频范围评价,声音的质量有几种档次
谈音质标准与音质评价方法 鉴别好音质
除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音质标准。
●音质标准
所谓声音的质量,是指经传输、处理后音频信号的保真度。目前,业界公认的声音质量标准分为4级,即数字激光唱盘CD-DA质量,其信号带宽为10Hz~20kHz;调频广播FM质量,其信号带宽为20Hz~15kHz;调幅广播AM质量,其信号带宽为50Hz~7kHz;电话的话音质量,其信号带宽为200Hz~3400Hz。可见,数字激光唱盘的声音质量最高,电话的话音质量最低。除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音质标准。
对模拟音频来说,再现声音的频率成分越多,失真与干扰越小,声音保真度越高,音质也越好。如在通信科学中,声音质量的等级除了用音频信号的频率范围外,还用失真度、信噪比等指标来衡量。 对数字音频来说,再现声音频率的成分越多,误码率越小,音质越好。通常用数码率(或存储容量)来衡量,取样频率越高、量化比特数越大,声道数越多,存储容量越大,当然保真度就高,音质就好。
声音的类别特点不同,音质要求也不一样。如,语音音质保真度主要体现在清晰、不失真、再现平面声象;乐音的保真度要求较高,营造空间声象主要体现在用多声道模拟立体环绕声,或虚拟双声道3D环绕声等方法,再现原来声源的一切声象。
音频信号的用途不同,采用压缩的质量标准也不一样。如,电话质量的音频信号采用ITU-TG·711标准,8kHz取样,8bit量化,码率64Kbps。AM广播采用ITU-TG·722标准,16kHz取样,14bit量化,码率224Kbps。高保真立体声音频压缩标准由ISO和ITU-T联合制订,CD11172-3MPEG音频标准为48kHz、44.1kHz、32kHz取样,每声道数码率32Kbps~448Kbps,适合CD-DA光盘用。
对声音质量要求过高,则设备复杂;反之,则不能满足应用。一般以“够用,又不浪费”为原则。
●音质评价方法
评价再现声音的质量有主观评价和客观评价两种方法。例如:
1.语音音质
评定语音编码质量的方法为主观评定和客观评定。目前常用的是主观评定,即以主观打分 (MOS)来度量,它分为以下五级:5(优),不察觉失真;4(良),刚察觉失真,但不讨厌;3(中),察觉失真,稍微讨厌;2(差),讨厌,但不令人反感;1(劣),极其讨厌,令人反感。一般再现语音频率若达7kHz以上,MOS可评5分。这种评价标准广泛应用于多媒体技术和通信中,如可视电话、电视会议、语音电子邮件、语音信箱等。
2.乐音音质
乐音音质的优劣取决于多种因素,如声源特性(声压、频率、频谱等)、音响器材的信号特性(如失真度、频响、动态范围、信噪比、瞬态特性、立体声分离度等)、声场特性(如直达声、前期反射声、混响声、两耳间互相关系数、基准振动、吸声率等)、听觉特性(如响度曲线、可听范围、各种听感)等。所以,对音响设备再现音质的评价难度较大。
通常用下列两种方法:一是使用仪器测试技术指标;二是凭主观聆听各种音效。由于乐音音质属性复杂,主观评价的个人色彩较浓,而现有的音响测试技术又只能从某些侧面反映其保真度。所以,迄今为止,还没有一个能真正定量反映乐音音质保真度的国际公认的评价标准。但也有报道,国际电信联盟(ITU-T)近期已批准一种客观评价音质的被称之为电子耳的新型测量方法,可对任何音响器材的音质进行客观听音评价,也可用于检测电话通讯语音编码系统的缺陷。
现将乐音音质评价方法综述如下:
(1)主观听判音效
通常,据乐音音质听感三要素,即响度、音调和愉快感的变化和组合来主观评价音质的各种属性,如低频响亮为声音丰满,高频响亮为声音明亮,低频微弱为声音平滑,高频微弱为声音清澄。下面结合声源、声场及信号特性介绍几种典型的听感。
①立体感
主要由声音的空间感(环绕感)、定位感(方向感)、层次感(厚度感)等所构成的听感,具有这些听感的声音称为立体声。自然界的各种声场本身都是富有立体感的,它是模拟声源声象最重要的一个特征。德·波尔效应证明,人耳的生理特点是:人耳在两声源的对称轴上,当声压差△p=0dB和时间差△t=0ms时,感觉两声源声象相同,分不出有两个声源;而当△p>15dB或△t>3ms时,人耳就感觉到有两个声源,声像往声压大或导前的声源移动,每5dB的声压差相当于lms的时间差。哈斯效应又进一步证明,当△t=5ms~35ms时,人耳感到有两个声源;而当近次反射声、滞后直达声或两个声源的时间差△t>50ms时,即使一次反射声(又称近次或前期反射声)或滞后声的响度比直达声或导前声的响度大许多倍,声源方位仍由直达声或导前声决定。
根据人耳的这个生理特点,只要通过对声音的强度、延时、混响、空间效应等进行适当控制和处理,在两耳人为的制造具有一定的时间差△t、相位差△θ、声压差△P的声波状态,并使这种状态和原声源在双耳处产生的声波状态完全相同,人就能真实、完整地感受到重现声音的立体感。与单声道声音相比,立体声通常具有声象分散、各声部音量分布得当、清晰度高、背景噪声低的特点。
②定位感
若声源是以左右、上下、前后不同方位录音后发送,则接收重放的声音应能将原声场中声源的方位重现出来,这就是定位感。根据人耳的生理特点,由同一声源首先到达两耳的直达声的最大时间差为0.44ms~0.5ms,同时还有一定的声压差、相位差。生理心理学证明:20Hz~200Hz低音主要靠人两耳的相位差定位,300Hz~4kHz中音主要靠声压差定位,更高的高音主要靠时间差定位。可见,定位感主要由首先到达两耳的直达声决定,
而滞后到达两耳的一次反射声和经四面八方多次反射的混响声主要模拟声象的空间环绕感。
③空间感
一次反射声和多次反射混响声虽然滞后直达声,对声音方向感影响不大,但反射声总是从四面八方到达两耳,对听觉判断周围空间大小有重要影响,使人耳有被环绕包围的感觉,这就是空间感。空间感比定位感更重要。
④层次感 声音高、中、低频频响均衡,高音谐音丰富,清澈纤细而不刺耳,中音明亮突出,丰满充实而不生硬,低音厚实而无鼻音。
⑤厚度感
低音沉稳有力,重厚而不浑浊,高音不缺,音量适中,有一定亮度,混响合适,失真小。
除此之外,还有许多评价音质的听感,象力度感、亮度感、临场感、软硬感、松紧感、宽窄感等。
(2)客观测试技术指标
①失真度
谐波失真,主要引起声音发硬、发炸;而稳态或瞬态互调失真主要引起声音毛糙、尖硬和混浊。二者均使音质劣化,若失真度超过3%时,音质劣化明显。音响系统的音箱失真度最大,一般最小的失真度也要超过1%。
相位失真,主要引起1kHz以下的低频声音模糊,同时影响中频声音层次和声象定位。
抖晃失真,主要是电机转速不稳,主导轴-压带轮压力不稳,磁头拍打磁带等造成磁带震动和卷带量变化,进而使信号频率被调制,声音音调出现混浊、颤抖。抖晃通常用音调变化的均方根值表示,通常,录音机的抖晃率<0.1%,Hi-Fi录音机<0.005%,普通录像机<0.3%,视盘机<0.001%。
②频响与瞬态响应
频响,指音响设备的增益或灵敏度随信号频率变化的情况,用通频带宽度和带内不均匀度表示(如优质功放的频响1Hz~200kHz±ldB)。带宽越宽,高、低频响应越好:不均匀度越小,频率均衡性能越好。通常,30Hz~150Hz低频使声音有一定厚度基础,150Hz~500Hz中低频使声音有一定力度,300Hz~500Hz中低频声压过分加强时,声音浑浊,过分衰减时,声音乏力;500Hz~5kHz中高频使声音有一定明亮度,过分加强时,声音生硬;过分衰减时,声音散、飘;5kHz~10kHz高频段使声音有一定层次、色彩;过分加强时,声音尖刺;过分衰减时,声音暗淡、发闷。按此规律,可根据各种听感,定量调节音响系统的频响效果。
瞬态响应,是指音响系统对突变信号的跟随能力。实质上它反映脉冲信号的高次谐波失真大小,严重时影响音质的透明度和层次感。瞬态响应常用转换速率V/μs表示,指标越高,谐波失真越小。如,一般放大器的转换速率>10V/μs。
③信噪比
信噪比,表示信号与噪声电平的分贝差,用S/N或SNR(dB)表示。噪声频率的高低,信号的强弱对人耳的影响不一样。通常,人耳对4~8kHz的噪声最灵敏,弱信号比强信号受噪声影响较突出。而音响设备不同,信噪比要求也不一样,如Hi-Fi音响要求SNR>70dB,CD机要求SNR>90dB。
④声道分离度和平衡度
声道分离度,是指不同声道间立体声的隔离程度,用一个声道的信号电平与串入另一声道的信号电平差来表示。这个差值越大越好。一般要求Hi-Fi音响分离度>50dB。声道平衡度,是指两个声道的增益、频响等特性的一致性。否则,将造成声道声象的偏移。
7. 怎样分辩波形声音质量
声音质量客观评价可分为两种:基于输入
输出的评价和基于输出
的评价。基于输入
-输出的评价是通过系统的输入信号和输出信号之间的差别来度量声音的质量 即通过提取两端号的特征参量
来建立评价模型;基于输出的评价是仅根据系统输出的退化后的信号来评价质量。
目前的客观评价方法都是以信号的时域、频域及变换域的的特征
参量作为评价依据,语音质量客观评价方法有如下几类:
(1)
基于
snr
评价方法
信噪比,即有用信号与噪声之比,是一种广为应用的简单客观评
价方法,一般来说,信噪比越大,混在信号里的噪声越小,声音的
质量越高,否则相反。
(2)基于lpc(linear predictive coding)技术评价方法该技术评价方法是以lpc分析技术为基础的,评价依据的参量是lpc系数及其导出参数
. 由 lpc 导出的方法有:线性反射系数、线谱对、lar(log area ratio) 、cd等方法以及它们的一些改进方法。
(3)
基于谱距离评价方法
该类评价方法是以语音信号平滑谱之间的比较为基础的,主要方
法有sd(spectral distance) lsd(log sd) fvlisd(frequency variant linear sd)fvlosd(frequency variant log sd)wsd(weighted slope sd),ilsd(inverse log sd)等。
(4)
基于听觉模型评价方法
基于听觉模型评价方法是以人感知语音信号的心理听觉特性为基
础,主要方法有
bsd
bark spectraldistortion)、mbsd、psqm、plp(perceptual linearprediction)、msd(mel spectral distortion)等。
(5)基于判断模型的评价方法该类评价方法是在选择表达语音质量的特征参量基础上,更主重于模拟人对语音质量的判断过程。主要方法有l(ad)/mnb-1以及l(ad)/mnb-2。
(6)其他评价方法
主要有一致函数chf法、信息指数法、专家模式识别epr法等。
3 软件实现本文在基于输入输出的客观评价方式的基础上,以vc++ 6.0为开发工具,着重于从频域方面提取音频特征参数来表征音频质量情
况,设计了一款能够显示波形,通过信噪比来辅助测评声音质量的
软件。
大量的实验表明,人类感知语音的过程和语音本身的频谱特性非
常密切。人类本身的听觉对语音的频谱特性更为敏感,两端在时域
上相差很大的语音如果具有类似的频谱特性,人类在感知它们时的
感觉也是相似的,因此通过显示文件的频谱波形及对比频谱波形上
的差异可以有效地辅助评测声音质量。
为了适应人的耳朵这种奇特的特性,即它对声音的响度的感觉是
与输出音频功率的对数成正比的,信噪比的大小可用有用信号功率
与噪声功率的比值的对数来表示,公式如下:
由于分段信噪比计算一段时间上的语音信号与噪声的平均功率之比,而语音信号是一种缓变的短时平稳信号,因此采用分段信噪比计算整个时间轴上的信噪比更能表征语音质量。本文的软件设计流
2所示:
3.1 分帧由于声音信号在短时间段上(通常为10-30ms)才被认为是平稳的。因此,将整个语音信号划分成一帧一帧来分析,帧长一般取为10-30ms。 3.2 加窗窗函数能把有限长的长序列变成有限长的短序列,然而也会带来
原来信号频谱的泄漏,为了减小或抑制泄露,需要选择合适的窗函
数。相对其他窗函数,汉明窗能够较好地抑制泄漏,因此本文选用
汉明窗对信号进行加窗处理,汉明窗定义为: w(n)=0.54-0.46cos(),n=0,1,…n-1 3.3 fft
傅立叶变换是数字信号处理中最重要的变换之一,其意义在于将
时域中难以看出什么特征的信号变换到频域中,在频域中信号特征
会一目了然,本文对音频信号进行频域分析采用的工具都是
fft
界面设计如图
3通过菜单栏上的特征参数波形显示中的显示功率谱、对数功率谱
来显示两个文件的波形,通过显示波形可以对比两个文件的差别,
找到差别即可交给系统处理人员分析原因进行改进。
通过信噪比snr、的显示结果辅助测评声音质量。
4 实验结果
通过选取部分原始文件和失真文件,经过了mos主观测试后,用此软件进行了验证,选取两组代表性的文件:
(1)为orig.wav
和noise.wav; (2)为orig.wav和orig1.wav, 图4相应显示其功率谱图及snr值。
实验结果显示+与原始文件接近的待测文件两者功率谱波形相
近,snr值大;与原始文件差别较大的待测文件两者功率谱波形相
差大,snr值小,接近主观评价测试的结果。相对于原始文件,对于有较大问题的待测文件,该软件可以很好的给予帮助,对于全部待测文件都要用主管评价的方法,这节省了
部分时间和精力,适用于实验室搞编码解码之后的声音质量评估环
节。然而对于出现在待测文件里的更精细的问题判断,还需要人的
主观评价方法。
8. 请问怎样从一个人的声音来评价她
如果声音细腻,那么就说温柔体贴;
如果声音活跃,那么就说活泼可爱;
如果声音偏厚,那么就说性情豪爽。
就看你自己怎么评价了啊。
9. 评价一个歌手声音该怎么评价
首先看他的嗓出的声音干不干净,再看有没有自身的特色吧,主要是看他本人唱歌能否唱进人的心里才是最重要的,每个人喜欢的歌手都不同,但是大家希望的是能从歌手唱出的声音中找到幸福,不只是因为他的声音如何,如果你喜欢,首先看他的为人,再来辨别他的声音好坏与否。