长期以来,由于语音的特殊性与复杂性,英语语音一直是英语学习的难点。研究发现,即使对于单音发音非常标准的学习者,外语口音的消除仍是一个几乎无法逾越的障碍[1]。对于语音,有学者认为外语语音在语音习得关键期之后就基本不可再习得,也有学者认为虽然绝对“标准”的英语发音不是每个学生都能达到的,但后期通过发音训练可以改善和提高,使学习者操一口流利顺畅、清晰易懂、交际自如的英语是可望又可及的目标[2]。
一、有关语音学习的中外文献回顾 (一)中国英语学习者的英语语音学习现状研究发现,中国英语学习者在英语语音学习方面存在较大困难[3]。使用英语传递信息时存在的语音问题,不仅会影响听者理解,更可能产生信息误解,导致交际困难或交际失败[4]。具体而言,陈桦总结出我国英语学习者在英语语音学习方面普遍存在如下问题:(1)重读、弱读不分明,甚至重音移位;(2)节奏不鲜明,没有轻重之分;(3)语调平直,升降起伏小,听起来呆板乏味;(4)掌握不好停顿的位置[5]。针对语音及语音习得所存在的问题,国内外学者进行了相关研究。Pikes总结相关研究发现外语学习的初始年龄、学习动机、一语迁移、目的语国家居住时间等对外语口语具有一定影响[6]。传统的语音学习方式(“听—读”模式)在很大程度上依赖于学习者良好的听辨感知能力,即学习者需要通过听辨并感知到自身发音与示范发音的不同,才能纠正发音错误。然而关于语音听辨感知和产出(Speech Perception and Production) 的研究认为很多语音产出错误的根源在于听辨感知的不佳。由于学生语音听辨能力存在个体差异,且听辨感知改进总是先于产出的改进[7-8],如果学习者语音听辨感知能力不够好,就会事倍功半,因此,传统学习方式并不适合所有的学习者。外语语音习得的一个关键环节就是要在语音习得过程中帮助学习者正确感知和比较外语语音与一语语音的不同之处。
(二) 国内外关于语音学习可视化方式的研究国内对计算机辅助可视化语音学习的研究起步较晚,侧重于介绍计算机辅助可视化语音学习的方式[9],探究其对英语语音学习的有效性[10-11]。庄木齐等通过应用Better Accent Tutor软件研究中国英语学习者语音学习超音段音位中的重音模式,发现可视化语音学习软件对于学习者具有实用性、适用性[12]。杨晋通过考察中国英语学习者利用Praat语音软件反复听音模仿英语语音语调的效果,发现Praat产生的音高曲线在帮助学习者观察句子的调核位置、句子重音分配和表达语句语用功能的语调等方面有一定作用,能够弥补单纯听音模仿中学习者因听辩能力不足造成的问题[10]。并且国内可视化语音学习相关实证研究较少,对英语学习者的实证研究通常只涉及英语语音系统中的某一部分。英语语音自身结构的复杂性和多变性使其语音特征并不像单个音素那样易于听辨和模仿[13],现有学术文献中缺乏对中国大学生英语语音可视化学习中的视觉反馈效果的深入研究,更未探究这种学习方式带来的效果是否能够概化到在相似话语层面上,从而对之后的语音学习产生积极影响。
国外最早从20世纪70年代开始将语音可视化技术与教学联系起来,探究其有效性。De Bot考察了反馈模式和练习时间两个因素对于语调学习的影响。结果发现,听觉和视觉(Auditory-Visual)的双重反馈模式优于单一听觉(Auditory)反馈模式,同时反馈模式也会影响学习者的行为[14]。
目前典型的VFP包括:(1)非母语者记录目标语输出;(2)语音特征的视觉显示,最常见的是语调轮廓;(3)以视觉方式展示母语者的作品,通常伴有相应的听觉展示以作比较;(4)非母语参与者重新录音,试图匹配母语者的输出。在此框架中对语音的超音段特征研究较多,特别是语调轮廓。如Levis和Pickering注意到这种范式对单词和语篇水平音高轮廓的指导都是有积极作用的[15]。Hardison发现VFP不仅有助于改善初始训练中学习材料的语调轮廓, 也能被推广到新的话语层面,具有概化性[16]。此外,技术水平的提高使研究虚拟语音对单个语音片段(如音节、辅音和元音)的影响成为可能。例如,Lambacher研究了二语课堂中的VFP,发现声音谱图能为学习者提供各种语音特征的视觉呈现[17]。Saito研究Praat语音分析软件发现,日本英语学习者在观看自己发音的视觉呈现后,经过修正练习其元音发音的准确性比以英语为母语的人还高[18]。
之后也有学者利用视觉反馈范式进行语音教学的研究,焦点多集中在非英语语言的某一语音特征。Olson以50名第二语言为西班牙语的大学生为研究对象,通过使用Praat语音软件,考察了VFP在音段输出的作用,以及视觉反馈在较低水平的语言课堂中的应用效果,研究证明了视觉反馈范式对西班牙语语音学习(在爆破层面)的有效性[19]。Chun等人以35位来自不同国家的中文学习者为研究对象,利用Praat软件对其语音输出进行可视化声学分析,通过音高曲线与语调曲线,辅以中文母语者的听觉判断,精确地反映了学习者的发音情况[20]。结果表明,视觉反馈能帮助学习者比较自身与母语者音高曲线的差异,即可视化声学分析能更准确地反映第二语言学习者的声调差异。此外,国外其他研究者通过实证研究发现视觉反馈在语音学习过程中对降低学习者焦虑情绪,提高纠错和准确性能力等方面都有积极影响[20-22]。
通过梳理国内外的研究,笔者发现虽然国外相关研究成果丰富,但很少涉及视觉反馈对母语为中文的英语学习者的学习效果影响,而国内对于视觉反馈的研究多停留在音段及超音段特征层面上。为了填补这部分研究空缺,笔者认为,有必要探究计算机辅助可视化语音学习环境下视觉反馈对中国英语学习者在单词和语句层面语音学习的效果。
在此背景下,本研究基于Praat软件探究视觉反馈范式运用于英语语音学习中的效果。Praat是一款跨平台的多功能语言学专业软件,其基本功能包含对语音的标注和分析,提供声调的轨迹等。学习者可以实时观察自身发音与母语者的差异,不断练习、录音和对比发音。
二、研究设计本研究旨在证实视觉反馈对二语英语语音学习是否具有有效性和概化性,以及收集学习者对其的使用态度。研究中的有效性是指学生通过使用语音软件,能够分析语音中存在的问题,并且利用软件的视觉反馈功能改善自身的语音水平;概化性则指学习者单词发音上的改善能扩展到相似词语及句子层面上。
(一)研究问题本研究主要采用视觉反馈范式(VFP)进行实验,包括预测、VFP训练、延时后测三个部分;同时在VFP训练后进行问卷调查收集数据,从而回答下列问题:
(1) 二语学习者在VFP训练后,单词层面的语音特征(失爆)是否得到改善?
(2) 这种语音上的改善能否扩展到相似话语层面中?
(3) 学习者对使用VFP进行语音学习的评价。
(二)研究对象及材料参加本次实验的对象来自于西南地区某双一流高校,共20名本科生(14位女生,6位男生),年龄在17—21岁。参加者被随机分成实验组和对照组,每组10人。为了更直观考察学生的语音学习效果,排除其他影响因素,本研究的参加者都为非英语专业学生,且都没有接受过系统的语音训练;为保证参加者能认真完成实验,实验组与对照组完成任务后均有一定报酬。
英语中的失爆有以下五个特点:(1)爆破音+爆破音; (2)爆破音+破擦音; (3)爆破音+摩擦音; (4)爆破音+鼻音; (5)爆破音+舌侧音。为避免分散学习者的注意力同时保证实验关注的重点是在语音提升方面,本研究选取的单词与句子皆包含了英语语音中“失去爆破”的特点,且涉及的单词拼写都很容易。表 1为预测试的刺激素材。
![]() |
表 1 预测试中的目标单词、短语、句子 |
1.预测试
为保证参加本次实验的对象语音水平相似,从而更直观地验证VFP对英语语音学习的有效性,笔者设置了预测试。在实验前,笔者要求实验组与对照组的学生根据所给单词,使用私人设备进行录音并严格控制噪音,完成之后上传提交以供笔者使用Praat软件进行分析。
2.VFP训练及态度调查
实验组采用VFP与听觉训练相结合的方式学习目标单词。实验开始后,实验组首先被统一指导学习Praat软件的浏览编辑和语音标注功能,然后开始用其实施VFP进行语音学习。本次研究采用Olson[19]的视觉反馈范式,该范式由三部分组成,具体的VFP实验步骤如图 1所示。
![]() |
图 1 基于视觉反馈范式(VFP)的实验步骤 |
对照组不参加VFP训练,仅重复倾听所提供的母语者音频进行模仿学习。两组实验使用的目标词语相同,两组对象完成上述步骤后上传目标词语的音频。训练结束后,实验组学生被要求填写一份调查问卷,内容主要是关于参加VFP训练的感受和观察到的视觉反馈特点。
3.延时测试
为研究视觉反馈效果是否具有持久性,在VFP训练完成一周后,笔者设置了延时测试。实验组学生被要求根据所给的新单词(句子)材料使用私人设备进行录音以供语音分析;而延时测试中新的单词(句子)材料也可证明视觉反馈是否具有概化性。
(四)研究工具研究者使用Praat软件计算每位参与者提交音频的平均强度比(Intensity Ratio),结合SPSS工具进行数据整理后分析参与者的语音输出是否得到改善。根据Ortega[23]的研究,语音的强度比定义为目标音素的最小音强(分贝)除以之前元音的最大音强(分贝)。强度比提供了一种口腔闭合(失爆)的测量方法,“1”表示一个完全打开的、类似元音的辅音,“0”表示一个完全闭合的、无声的停顿。
三、数据分析VFP的有效性及其持久性,笔者将通过对平均强度比的单因素方差分析以及对比实验组与对照组的强度比的平均值来证明;VFP的概化性分析则通过听觉评测进行;学习者对VFP使用的态度,将通过对问卷调查进行文本分析后进行总结。
(一)VFP有效性分析为探究视觉反馈是否具有有效性,首先要保证实验组与对照组学生的语音水平相近。笔者对预测试中两组学生的语音平均强度比数据进行检验,其单因素同质性测试说明该组数据可使用单因素方差分析(p=0.324>0.05,见表 2);之后单因素方差分析结果说明,实验组与对照组的预测试数据之间并无显著差异(p=0.181>0.05,见表 3),证实实验组与对照组学生在实验前并没有较大的语音差异。
![]() |
表 2 实验组与对照组预测试中平均强度比的方差齐性检验 |
![]() |
表 3 实验组与对照组预测试中平均强度比的单因素方差分析(ANOVA) |
其次,笔者对实验组与对照组学生训练后的平均强度比数据进行对比,两组数据的单因素同质性测试表明,该组数据可使用单因素方差分析(p= 0.996 > 0.05,见表 4);单因素方差分析结果表明,对照组与实验组训练后的平均强度比数据之间存在显著性差异(p=0.014 < 0.05,见表 5),说明两组学生经过不同训练,语音水平出现差异。
![]() |
表 4 实验组与对照组实验后平均强度比方差齐性检验 |
![]() |
表 5 实验组与对照组实验后平均强度比的单因素方差分析(ANOVA) |
最后,笔者进一步分析训练后两组实验对象提交的音频平均强度比数据发现,实验组学生的语音输出更接近于英语母语者(实验组:0.603 < 对照组:0.699,见表 6)。具体来看,对照组中的6号学生(“对照组6”)的平均强度比为0.833,表明该学生发出了一个类似元音的辅音,声带产生了摩擦震动,该学生没有很好地达到失爆要求;而实验组中7号学生(“实验组7”)的平均强度比为0.453,表明该学生较大程度上抑制了辅音的发音,声带在一定程度上进行了闭合控制,该辅音的发音听起来几乎是省略或停顿的,较好地做到了失爆要求。总体来看,实验组实验后的平均强度比M=0.603,标准差SD=0.071,而对照组实验后的平均强度比M =0.699,标准差SD =0.067。
![]() |
表 6 实验组与对照组实验后平均强度比数据展示与对比 |
为了解实验组学生语音改善的程度,笔者对实验组学生预测试和实验后的音频数据进行对比分析。单因素同质性测试表明两组数据可以进行单因素方差分析(p= 0.891 > 0.05,见表 7);单因素方差分析结果说明实验组在实验前、后数据有显著性差异(p=0.024 < 0.05,见表 8),说明实验组学生在实验前后语音水平出现差异,可以进行下一步分析。
![]() |
表 7 实验组实验前、后平均强度比的方差齐性检验 |
![]() |
表 8 实验组实验前、后平均强度比的单因素方差分析(ANOVA) |
图 2为实验组学生实验前、后的平均强度比数据图,横轴代表每位实验组学生的编号,纵轴为平均强度比。通过比较分析每位实验组学生测试前、后的音频数据可知,在参加VFP训练的10名学生中,有8名学生的语音平均强度比在实验后有所下降,仅有2名学生有轻微上升。究其原因,可能是因为个人学习风格不同所导致的。有关研究表明,学习者在接受到不擅长处理的信息形式时,其激活程度相较与擅长信息较低,并且处理任务的动力也较低。具体来说,这2名学生可能对于非视觉信息的处理能力较强,所以对于实验中VFP的接收程度相比其他学生较低[24]。总体来说,实验组对象预测试的平均强度比(M)为0.676,而实验后降低到了0.603。
![]() |
图 2 实验组实验前、后平均强度比的展示及对比 |
为探究视觉反馈是否具有持久性,笔者对实验组实验后数据与一周后的延时测试数据进行单因素同质性测试,结果表明该组数据可以使用单因素方差分析(p=0.096>0.05,见表 9);单因素方差分析结果表明,一周后参与者的水平与实验后提升的水平并无显著性差异(p=0.791>0.05,见表 10),即实验组学生通过视觉回馈范式得到的语音提升具有一定的持久性。同时,从实验组总体的平均强度比(实验后M=0.603, 延时测试M=0.590)来看,实验组学生的语音水平还有轻微的提升。由此可知:利用VFP得到的语音改善具有可持续性,对后续的学习具有一定的积极影响。
![]() |
表 9 实验组实验后与延时测试数据平均强度比的方差齐性检验 |
![]() |
表 10 实验组实验后与延时测试数据平均强度比的单因素方差分析(ANOVA) |
VFP概化性是针对于有效性而言的,指单词层面的语音改善能扩展到相似话语(句子)层面。对于概化性分析(即句子中的失爆分析)笔者采用传统的听觉分析,通过反复认真倾听实验对象的音频,来判断是否达成了失爆要求。使用听觉分析的原因主要在以下三个方面:(1)口语习惯中的失爆通常为忽略发音,直接链接到下一个词的音节;(2)在分析实验组学生句子的语音特征时发现,在句子发音中采用忽略发音来达成失爆时无法采集到失爆音节的强度(甚至是共振,语调等指数);(3)小部分参与者虽然能采集到短暂的失爆音节数据,但大多数参与者采用忽略发音,语音数据无法采集,所以难以对比分析。
本研究将话语层面的失爆程度分为三个等级:“0”表示完全失爆,即没有发出划线音素;“0.5”表示将失爆通过延长前一个音节或用“/n/”来代替失爆音的发音方法;“1”则表示该参与者的失爆音没有任何抑制,完整地呈现出来。以某一实验者为例:
![]() |
表 11 某参与者预测试的句子失爆程度评价 |
在表 11中,通过听觉分析可知实验组参加者在实验前(预测试)与延时测试中句子层面的失爆程度有显著不同。实验前10位参与者总分为15,而延时测试总分为10.5,另外延时测试中句子总失爆测验数量比实验前多5处。
(四)学习者对VFP的评价对于第三个研究问题,通过对调查问卷进行文本分析后,笔者发现实验组学生对VFP持肯定态度,其评价主要集中在以下方面:第一,视觉反馈显示出的语音图像差别较为直观。在VFP实验中,多数学生能发现自身与母语者语音之间的明显区别,并且用文字清楚地表达出来(N=8);第二,视觉反馈能够反映出单个音素的相对音长与音强。实验组学生通过声音的共振峰图像,能够判断出某一音素的发音时长以及其与周围其他音素的相对强度程度(N=9);第三,视觉反馈能为实际发音提供指导。实验组学生能够将语音可视化图像的视觉差异与实际发音的要求联系起来(N=7)。
四、VFP实验结论通过对实验组与对照组的语音学习数据进行分析,之前的三个研究问题有了相应结论:
对于第一个研究问题,实验组的语音(失爆)较对照组有所改善,即比起传统训练方式VFP能带来更好的英语语音学习效果。除此之外,通过检测延时实验的录音笔者发现,VFP训练中使用的母语者音频对学生的语调具有一定的积极影响;实验组学生通过VFP实验后,对于失爆音的控制变强了,能够在发音时及时闭合口腔,80%的实验组学生通过VFP实验的训练语音水平有所改善;更重要的是,通过VFP得到的语音改善具有可持续性,对后续的英语学习具有积极影响。
对于第二个研究问题,通过对参与VFP训练的学习者的语音数据进行失爆程度评测后,发现单词层面的失爆改善同样也可以扩展到相似话语(句子)层面,即VFP具有概化性。
对于第三个研究问题,通过对所设计的问卷进行文本分析后,笔者发现实验组学生对VFP持肯定态度。同时,VFP具有以下特点:第一,视觉反馈显示出的语音图像差别较为直观;第二,视觉反馈能够反映出单个音素的相对音长与音强;第三,视觉反馈能为实际发音提供指导,使学习者将语音可视化图像的视觉差异与实际发音的要求联系起来。
五、结语本研究通过对比对照组与实验组数据,证明了利用VFP进行语音教学可取得比传统听觉训练更好的学习效果,进行VFP取得的语音改善也具有一定的持久性和概化性。值得注意的是,本实验在视听教室进行,时长约为一小时,参加实验的人数为10人,由此,VFP运用于实际教学中也具有一定的可行性。
本研究证实了语音教学中运用VFP能提升初阶水平语音学习者的英语能力,也弥补了之前语音研究受限实验室环境、过分依赖传统的听觉分析和教师指导等不足。通过把母语者发音和学习者发音进行可视化展示,使反馈信息更加直观和客观,弥补了学习者听辨能力个体差异性的问题。同时该方法可以提高学习者的语音学习对比意识和听辨能力,再辅以母语者音频(模仿训练)的输入,学习者在自主进行语音输出的检测分析获得启发后,可再次进行回馈式输出。
笔者建议,后续的相关研究可以扩大受试群体,将更多不同英语水平的受试纳入实验设计中,探究VFP与学习者个体特征之间的关系;可设计不同长度,不同难度的学习材料;以及进一步探究语音语调学习是否具有泛化性。同时研究者也可以尝试设计与开发相关的语音可视化学习APP,更深层次将现代技术与语音学习融合。
[1] |
Cruz-Ferreira M. A test for non-native comprehension of intonation in English[J]. IRAL-International Review of Applied Linguistics in Language Teaching, 1989, 27(1): 23-40. |
[2] |
王桂珍. 精品课程内涵的建设——国家级精品课程"英语语音"的课程建设[J]. 广东外语外贸大学学报, 2007, 18(5): 8-10. |
[3] |
杨军, 陈桦. 二语口语产出的韵律——与朗读相关的文献研究[J]. 外语研究, 2005(5): 48-52. |
[4] |
陈桦. 中国学生朗读口语中的英语调型特点研究[J]. 现代外语, 2006, 29(4): 418-418. DOI:10.3969/j.issn.1003-6105.2006.04.011 |
[5] |
陈桦. 学习者英语朗读中重音复现的节奏归类研究[J]. 外语与外语教学, 2008(3): 35-37. |
[6] |
Piske T, Mackay I, Flege J E. Factors affecting degree of foreign accent in an L2:a review[J]. Journal of Phonetics, 2001, 29(2): 191-215. DOI:10.1006/jpho.2001.0134 |
[7] |
Best C. Development of language-specific influences on speech perception and production in pre-verbalinfancy 1999[C]//International Congress of Phonetic Sciences. USA, San Francisco, 1261-1263.
|
[8] |
Flege J E, Munro M J, Mackay I R A. Factors affecting strength of perceived foreign accent in a second language[J]. Journal of the Acoustical Society of America, 1995, 97(5): 3125. DOI:10.1121/1.413041 |
[9] |
卜友红. 利用教学媒体, 促进英语语音教学[J]. 外语电化教学, 2003(3): 52-55. |
[10] |
杨晋. 中国英语学习者英语名词词重音习得研究[C]//中国语音学学术会议暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会论文集, 2008.
|
[11] |
庄木齐, 卜友红. 语音教学可视化研究[J]. 电化教育研究, 2011(2): 92-98. |
[12] |
庄木齐, 卜友红. BetterAccent Tutor与超音段音位可视化教学研究[J]. 外语电化教学, 2011(2): 31-38. |
[13] |
Chun D M. Signal analysis software for teaching pronunciation[J]. Language, Learning and Technology, 1998, 2(1): 61-77. |
[14] |
Bot K D. Visual feedback of intonation I: effectiveness and induced practice behavior[J]. Language & Speech, 1983, 26(4): 331-350. |
[15] |
Levis J, Pickering L. Teaching intonation in discourse using speech visualization technology[J]. System, 2004, 32(4): 505-524. |
[16] |
Hardison D M. Generalization of computer assisted prosody training: quantitative and qualitative findings[J]. Language Learning & Technology, 2004, 8(1): 34-52. |
[17] |
Lambacher S. A CALL tool for improving second language acquisition of English consonants by Japanese learners[J]. Computer Assisted Language Learning, 1999, 12(2): 137-156. |
[18] |
Saito K. The influence of explicit phonetic instruction on pronunciation teaching in EFL settings: the case of English vowels and Japanese learners of English[J]. Linguistics Journal, 2007, 3. |
[19] |
Olson D J. Benefits of visual feedback on segmental production in the L2 classroom[J]. Language, Learning and Technology, 2014, 18(3): 173-192. |
[20] |
Chun D, Jiang Y, Meyr J, et al. Acquisition of L2 Mandarin Chinese tones with learner-created tone visualizations[J]. Journal of Second Language Pronunciation, 2015, 1(1): 86-114. |
[21] |
Hincks R, Edlund J. Promoting increased pitch variation in oral presentations with transient visual feedback[J]. Language Learning & Technology, 2009, 13(3): 32-50. |
[22] |
Weltens B, De Bot K. The visualisation of pitch contours: some aspects of its effectiveness in teaching foreign intonation[J]. Speech Communication, 1984, 3(2): 157-163. |
[23] |
Ortega-Llebaria M. Interplay between phonetic and inventory constraints in the degree of spirantization of voiced stops: comparing intervocalic/b/and intervocalic/g/in Spanish and English in T. L. Face (Ed. )[M]//Laboratory Approach to Spanish Phonology. Berlin: Mouton de Gruyter, 2004.
|
[24] |
Chisholm I M, Beckett C E. Teacher preparation for equitable access through the integration of TESOL standards, multiple intelligences and technology[J]. Technology Pedagogy & Education, 2003, 12(2): 249-275. |