1b. 武汉大学中国科学评价研究中心, 湖北武汉 430072;
2. 山西大学 数学科学学院, 山西 太原 030006
1b. Research Center for China Science Evaluation, Wuhan University, Wuhan 430072, P. R. China;
2. School of Mathematical Sciences, Shanxi University, Taiyuan 030006, P. R. China
科学评价是科学管理的前提,也是推动组织发展的间接动力[1]。中国目前有2 700多所高校、3 000多万在校生,居世界第一[2],2010年普通高校专任教师人数已超过134万人,2012年国家财政性教育经费支出达到国内生产总值的4%。对中国如此大规模的高等教育体系来说,科学的评价和管理非常必要。
中国教育评估制度确立于20世纪80年代中期[3-4],此后对高等教育评估和评价的研究越来越热:研究的主体越来越多,既有官方,也有高校科研机构,还有第三方;评价的范围越来越广,从对高职高专到对世界一流大学的评价;评价的对象越来越全面,教学、科研、教师和学生都成为评价对象,目前已形成比较完整的教育评价研究领域。
经过近30年的发展,中国高等教育评价研究取得了很大进步,但也面临理论和方法创新不足的问题。为了进一步的发展,需要对研究的现状、特点、发展历程、成就和经验进行全面的总结。作者从文献计量学的角度,试图从这些理念不一、体系不一、重点各异的评价研究中,宏观分析中国高等教育评价研究的重点、热点和演变过程,理出几条有益的结论。目前计量学方法已经被用于对中国教育研究领域的热点分析[5-6]、对民办高等教育的研究[7-8]以及对高等职业教育的踪迹、特征和走向分析等[9];也有对大学教师发展的研究[10]。但是在对中国高等教育评价和评估的研究中还未曾见到。
二、研究现状对中国高等教育评价的研究,得益于教育改革开放的大环境。中国高等教育的评价工作始于教育改革开放的初期,而对高等教育评价的研究略早。第一篇真正意义上研究高等教育评价的文章是1983年王金凯的《关于高校科研机构及人员的评价指标体系》[11]。这篇文章比较系统地提出了对科研机构和人员评价的指标体系,但没有引文,或许可以推测之前可能没有这方面的文章公开发表。
1985年中共中央启动教育评估。此后经过一系列制度上的完善,如1990年10月发布《普通高等学校教育评估暂行规定》,1993颁布《中国教育改革和发展纲要》,2002年制定了《普通高等本科教学工作水平评估方案(试行)》(2004年进一步修订)。教育部从2003年开始实施五年一轮的“高等学校本科教学工作水平评估”制度,截止2008年,完成了对592所高校的第一轮评估[12]。
当教学评估在全国高等教育单位开展的同时,对高校教师、课程、教学等评价在20世纪80年代末也开始进行,此后,武书连、邱均平等学者对大学评价的实践逐渐走入大众的视野。目前,已有多家大学或机构定期发布多项评价报告,如武汉大学中国科学评价研究中心、中国校友会、上海交通大学等机构。
评价研究经过30多年的探索和发展,已经形成宏大的研究领域,有着一批专业的研究队伍。但是还没有对这个领域的作者、机构的合作关系进行全面的分析,也没有对评价主题进行科学的计量分析和研究,从而使得该学科的发展前沿热点及其演变不是非常明朗。
三、研究方法和分析工具 (一) 共现理论共现理论是一种时空相关分析方法,应用非常广泛。科技文献的共现分析是指相同或不同类型特征项共同出现的现象,可涵盖共引(耦合)和共被引分析、共词分析、主题词链(共篇)分析、合著分析等方法。关键词共现分析即为共词分析,作者或机构合作或共现分析即属于合著分析。一般要借助于可视化网络分析软件,如Ucinet、NetDraw、Pajek等,呈现共现的结果。本文通过对高频关键词的共现探析研究主题的热点和主方向。
(二) 社会网络分析(SNA)关于社会网络分析的分析,有的称之为结构分析,有的称之为网络分析[4]。加拿大社会网络分析家巴里·韦尔曼曾指出:“网络分析探究的是深层结构——隐藏在复杂的社会系统表面之下的一定的网络模式。”[5]文中主要构建了高频关键词的网络图,根据不同的中心度测度方式研究它们在共现网络中的重要性。
(三) 分析工具NetDraw以其形象直观的图形化显示功能,简单易学的操作性,优秀的开放兼容性为社会网络分析注入了新的活力,目前已被广泛应用于社会网络分析研究。UCINET软件集成了软件NetDraw和Mage,同时集成了Pajek用于大型网络分析的Free应用软件程序,有很强的矩阵分析功能,主要分析计算网络结构的特征指数。文中利用UCINET和Netdraw呈现高频关键词的网络结构及结点中心性,并使用SPSS聚类划分研究主题的主要方向。
四、数据准备本文分析对象是中国高等教育的评价研究,以中文文献数据库CNKI中的中国学术期刊网络出版总库为数据来源。核心检索词是评价和评估,限定范围是高等教育,包括高等院校、高校教师、高校科研和教学等主题。通过常用概念的比较,选择了10个检索词,检索式如下:SU=(评价*大学(2)+评价*高校+评价*高等教育+评价*高等学校+评价*高教)+(评估*大学(2)+评估*高校+评估*高等教育+评估*高等学校+评估*高教)。其中检索词“大学”的频次设为2是为了排除不相关文章。截至2011年5月30日,在学术期刊网络出版总库中检索到相关主题的有效文章35 859篇。
经过统计发现:从时间分布看,相关主题文章在2000年后大幅快速逐年递增,2011年达到4 966篇,且近10年的文章占所有文章的83%;从学科分类看,前15个学科包括了前75个学科相关论文的88%,近60%属于高等教育,随后为体育、图书情报与数字图书馆、教育理论与教育管理、计算机软件及计算机应用,共约占全部论文的75%;从资助情况看,有1 589篇文章受各类基金资助,其中全国教育科学规划、国家自然科学基金和国家社会科学基金资助的文章占47.7%。与前述不同的是,单位分布和期刊分布相对平均,变异系数分别为0.36和0.54,未达到“二八律”程度。
五、中国高等教育评价研究热点与方向探析 (一) 关键词的频次分布关键词是一篇文章的简单描述,关键词的结构所反映的就是文章研究主题的结构。因此通过关键词的共现结构探析文章主题的结构行之有效。
通过对所采集文章的关键词进行整理和统计,发现频次在100及以上的有127个,占所有关键词35 593的0.36%,但他们的频次35 196却占到了所有关键词频次138 215的25.5%,说明研究主题非常集中。前20位的关键词及词频分布见图 1,词频最高的有高校、高等学校、大学生等实体对象,也有高等教育、教育质量等抽象对象,其中“高校”的词频明显高于其他高频词。进一步研究发现关键词中近义词或同义词很多,这是一个很重要的问题,因为这种现象可能掩盖了重要的主题,也可能产生几个及其相近的主题,使分析结果不再可信。因此需要做的就是同义词或近义词的合并。
![]() |
图 1 关键词词频分布图(最高的前20位) |
同义或近义关键词的合并,可视为一种主题的聚集。本文基于文献分析和语言表达习惯将高频关键词进行合并,部分如表 1所示。为了区别,我们称合并前的关键词为基本关键词,由诸多基本关键词合并后的词称为相应基本关键词的代表性关键词,简称关键词。
![]() |
表 1 基本关键词合并表(部分) |
出现如此多的相似词,或许反映了在该领域的研究中用词不规范的现象。这种现象会使某些研究热点淡化。比如对于科学研究的评价和评估是一个热点,但没有出现在高频词列表中,而是紧随其后,原因就是其表述过于多样化。为此,笔者专门将其列为代表关键词之一,以便检验。经过合并和增补,最后形成51个代表关键词(表 2)。
![]() |
表 2 代表性关键词的三个中心性度量值比较(部分) |
使用Excel VBA程序,进一步得到了51个关键词的共现矩阵。导入Ucinet后计算网络及节点(关键词)的特征指数,如中心性等。然后使用Netdraw做出关键词共现网络图。为了便于理解,在保证图形清晰的前提下,图 2中部分代表性关键词采用两个基本关键词表示。
![]() |
图 2 代表性关键词共现网络图 |
通过对关键词共现的分析及其图形展示,可以发现高频关键词之间的联系。如高校、教学评估、教学管理、评价指标体系分别与其它代表性关键词都有共现,反映了研究中的主要对象和手段。但要发现网络中的关键点,还要对节点的中心性进行计算并予以表示。图 2即为带中间中心性的关键词共现图,图中黑色圆点为关键词,圆的大小表示节点中心度的大小,连线表示两者共现的存在。
中心性的定义多种多样,不同的定义反应节点不同的特性。本文采用三种。其一是点的度数中心性(degree),反应该节点和其它节点的共现次数大小;其二是点的中间中心性(betweenness centrality),反应节点在网络中控制其它节点共现的能力;其三是点的接近中心性(closeness centrality),反应节点与其它所有节点共现的个数[6-7]。
表 2列出了节点三个中心性的数量值,分别按高低顺序排列,序号代表相应关键词。可以看到度数中心性高的不一定其它中心性高,中间中心性和接近中心性最大的前六个关键词相同。具体来讲,“高校”的中间中心性和度数中心性最高,且接近中心性最小(等于节点数量减1),这说明它是本领域研究的主要对象。“高校”、“教学评估”、“教学管理/改革”和“评价指标体系”与其它关键词都有共现关系,说明他们是研究的热点主题。“科研评估”和“科研评价”的接近中心性最大,说明对它们研究的独立性较强。
通过比较可见,多数词的中间中心性和度数中心性大小不一,这符合定义本身。但是部分关键词例外,比如“高校”和“高等教育”,说明它们是最平凡的热点主题。对于有较低度数中心性和较高中间中心性的点,可能是关键连接点,比如“教师评价”,尽管还不够明显。
(四) 评价研究主要方向的发现通过关键词合并后的主题共现分析,我们发现部分研究热点,进一步的聚类分析可以帮助了解研究领域的主要方向。图 3为关键词聚类图,如果取阈值等于13,则可以将其分成四类(各类见图 3标号)。
![]() |
图 3 代表性关键词聚类图 |
从图 3可见,第四类的独立性最强,主要涵盖教学质量和评估以及实验室的建设和评估,而主体正是官方,因此这一方向可以概括为“教育部本科教学水平评估研究”。第三类有很多子类,比如“美国”和“启示”为一类,说明对美国教育评价研究的借鉴较多;“高等教育”与“质量保障”说明当前对高等教育的评价研究较多围绕质量展开;科研方面与评价指标体系等共现说明科研评价是较重要的研究方向;而“绩效评价”和“高校教师”一类说明绩效评价的重点对象是教师。这些看似复杂的主题可以概括为“高等教育的质量评价研究”,对应于文献[9]中的“质量与评估”主题。而其中又有教师评价、绩效评价、科研评价等子方向。第二类包含了近一半的关键词,涉及到大学生思想政治教育、人才培养、创新能力、教学改革、课程建设等,可以概括为“高等教育的软环境评价研究”,软环境相对于教学设施等“硬条件”而言。而第一类,没有特别的意义,在任何领域的研究中都要考虑现状,都为了解决问题而提出对策或建议。
总结而言,我们将对高等教育的评价研究分为三个范畴:最核心的是教育部主导的本科教学水平评估,它起着引导性的作用;比它大一点的是围绕高等教育质量建设的几个大的评价方面,如教师评价、绩效评价、科研评价等,它是该领域研究的主力;最大的外围是涉及到高等教育各个层面的评价研究,它是评价研究在高等教育领域研究的触角。
(五) 评价研究主题的演变为了探析研究前沿热点及热点随时间变化,笔者进一步分析了代表性关键词的历年变化。有关评价和评估的多数关键词都是从1983年开始逐渐出现的,如素质教育、绩效评估、教师评价、美国、科学发展观、科研评价/评估在新世纪才崭露头角,逐渐成为新的研究前沿。而几乎与此同时,传统的研究主题,如高校、教育改革、评价指标体系、评估、对策/建议等相关文章数量快速增长,成为前沿热点。通过以上分析,可以将1980年以来的评价研究分为三个阶段,分别以1984年和2002年为时间分界线。这也反映了理论研究先于实践的一般规律。此外,我们也看到了评估/评价方法的文章没有明显的增长,说明在方法创新上进展不大。
六、思考其一,在本文中作者的基本观点不区分评估和评价,但作者并没有将两者完全混为一谈,而是有意分开,最后检验了两者的一致性。思路是考察围绕评估的相关主题与研究评价的相关主题在词频上的差异是否明显,如果差异显著,则可区分。为此作者计算“评估”和“评价”相近的代表性关键词(组)和其它代表性关键词(组)的频次之间(除去两者相互之间的共现频次数后)的相关系数得0.915,可见在用词的习惯上不易区别。当然微小的区别也有,比如谈到教育部的必然是评估,这是一种约定俗成。
其二,进一步分析了共现强度较高的高频关键词之间的关系。将共现强度阈值设为100,得到图 4。大学(University)必然是研究的中心,并且它与评估、教学质量、教学管理、教学、教学评估、评估指标体系、评价指标体系形成了一个紧密的小团体,因此对教学评估的研究仍然是中国高等教育评价领域研究的主要方向。
![]() |
图 4 阈值100下的高频关键词共现网络图 |
作者以在中国知网(CNKI)学术期刊网络出版总库中按前述规则截止2012年5月30日检索到的有关中国高等教育评估和评价的期刊文献的关键词为数据源,通过共现分析并结合社会网络分析的解释,得到以下几点结论及建议。
第一,研究规模越来越大,但研究主题比较集中。近十年发文量逐年较快增长,2011年超过4 000篇。关键词涉及面很广,但前0.36%的高频关键词频次占全部关键词频次的25.5%,可见研究主题比较集中。
第二,研究热点突出。高校、教学质量、评估、教学、教学管理和评价指标体系等是研究较多的热点主题。除去平凡主题“高校”外,教学评估、教学管理、评价指标体系、高校教师和评估等具有较强的辐射性,与其他研究主题都有不同程度的共现。
第三,研究方向相对明晰,教学评估仍是主要方向。将共现矩阵转化为相关矩阵后利用SPSS进行聚类,根据聚类结果将主题概括为“教育部本科教学水平评估研究”、“高等教育质量评价研究”和“高等教育的软环境评价研究”三类。核心是评估,外围是高校方方面面的软环境评价。
第四,研究主题演变比较清晰。20世纪80年代以来,中国高等教育评价经过两次较明显的发展。第一次是1984年前后,大量新的主题出现,拓展了研究领域。第二次是2002年左右,部分热点迅速增长,形成前沿热点。
本文通过对中国高等教育评价研究领域主题的宏观研究,得到了以上四点结论,通过这些结论,我们对当前该领域的研究做出如下的判断和建议。其一是抓住高等教育评价研究发展的机遇期,继续拓展研究对象和范围,使教育评价更好地为教育管理和改革服务。其二是加强评价理论和方法创新,只有这样才能给评价研究带来更大的内生动力。第三是提倡绩效评价,在评价中更多地体现效率的思想,使高校在加强规模建设的同时,注重效率和质量的建设。
[1] | 邱均平, 文庭孝. 评价学:理论·方法·实践[M]. 北京: 科学出版社, 2010. |
[2] | MBA环球网[EB/OL]. [2012-03-27]. www. mbatrip. com]: http://www.mbatrip.com/news/edu/20120327/28908.shtml. |
[3] | 王战军, 孙锐. 我国高等教育评估制度演进趋势探析[J]. 高等教育研究, 2000(6): 78–81. |
[4] | 王德林. 我国高等教育评估制度的合法性审视[J]. 高校教育管理, 2012(4): 38–42. |
[5] | 汤建民. 国内高等教育研究现状和发展动向的计量分析[J]. 现代大学教育, 2007(5): 45–50. |
[6] | 潘黎, 王素. 近十年来教育研究的热点领域和前沿主题[J]. 教育研究, 2011(2): 47–53. |
[7] | 王义娜. 改革开放30年我国民办高等教育研究综述[J]. 民办教育研究, 2009(1): 12–18. |
[8] | 汤建民. 近十年来国内民办高等教育的研究足迹[J]. 现代大学教育, 2009(2): 27–33. |
[9] | 范笑仙, 汤建民. 近十年来中国高等职业教育研究的轨迹、特征和未来走向[J]. 中国高教研究, 2010(10): 18–23. |
[10] | 高桂云, 王兆瑞. 2001-2009年我国大学教师发展的研究现状及进一步推进此研究的建议[J]. 高等教育研究, 2012(2): 55–57. |
[11] | 王金凯. 关于高校科研机构及人员的评价指标体系[J]. 山东工学院学报, 1983(1): 63–67. |
[12] | 康宏. 高等教育评价标准的价值反思[M]. 青岛: 中国海洋大学出版社, 2011: 155-166. |
[13] | 林聚任. 社会网络分析:理论、方法与应用[M]. 北京: 北京师范大学出版社, 2009. |
[14] | BARRY WELLMAN. Network analysis:Some basic principles[J]. Sociological Theory, 1983(1): 157. |
[15] | 刘军. 整体网分析讲义[M]. 北京: 世纪出版集团, 2009: 97-107. |
[16] | 王运锋. 社会网络分析与可视化工具NetDraw的应用案例分析[J]. 现代教育技术, 2008, 18(4): 85–89. |
[17] | 余秀兰. 高等教育研究领域中的女性——基于对《高等教育研究》2001-2010年的载文分析[J]. 高等教育研究, 2012(6): 52–58. |