文章快速检索    
  重庆大学学报(社会科学版)  2014, Vol. 20Issue (6): 115-122  DOI: 10.11835/j.issn.1008-5831.2014.06.016 RIS(文献管理工具)
0

引用本文 

杨红艳. 人文社科成果评价管控机制的理论思考—以创新和质量为导向[J]. 重庆大学学报(社会科学版), 2014, 20(6): 115-122. DOI: 10.11835/j.issn.1008-5831.2014.06.016.
YANG Hongyan. Theoretical Thinking on the Mechanism of Management and Control for Humanities & Social Sciences Publications Evaluation:Oriented to Innovation and Quality[J]. Journal of Chongqing University(Social Science Edition), 2014, 20(6): 115-122. DOI: 10.11835/j.issn.1008-5831.2014.06.016. .

基金项目

国家社会科学基金青年项目"创新和质量导向的中国人文社科学术成果评价管理控制机制研究"(12CTQ022)

作者简介

杨红艳(1981-), 女, 内蒙古通辽人, 中国人民大学人文社科学术成果评价研究中心副编审, 管理学博士, 主要从事学术评价、信息资源管理、电子政务研究。

文章历史

修回日期: 2014-05-27
人文社科成果评价管控机制的理论思考—以创新和质量为导向
杨红艳     
中国人民大学 人文社科学术成果评价研究中心, 北京 100872
摘要: 文章以创新和质量为导向,针对中国人文社科学术成果评价体系各要素存在的不足,对应予以管理和控制的关键因素及其作用关系和内在机理进行了系统的理论探讨,并指出应围绕评价信度、效度和调和度三个关键维度,确定管控的内容、方式和手段,建立有效的评价管理控制机制。
关键词: 人文社会科学    学术评价    评价机制    创新    质量    
Theoretical Thinking on the Mechanism of Management and Control for Humanities & Social Sciences Publications Evaluation:Oriented to Innovation and Quality
YANG Hongyan     
Academic Publication Evaluation Center, Renmin University of China, Beijing 100872, P. R. China
Abstract: Oriented to innovation and quality, and aiming at problems in factors of China's humanities & social sciences publications evaluation system, this paper systematically and theoretically discusses key factors and their roles, relationships and internal mechanism which should be managed and controlled, and proposes to establish an effective mechanism of management control for evaluation, in which targets, patterns and methods with management and control should be decided on the base of three key dimensions -evaluation reliability, validity and reconcile degree.
Key Words: humanities & social sciences    academic evaluation    evaluation mechanism    innovation    quality    
一、引言与研究框架 (一) 研究问题及现状

人文社科成果是人们在从事人文社会科学研究和实践活动中,通过创造性劳动所取得的具有规律性认识或改造世界作用的成就或结果。对人文社科成果进行评价,是判断成果价值和能否广泛推广实施的重要尺度,也是使成果获得同行和社会承认,鼓励学者开展学术研究的必要途径。目前,中国人文社科学术成果评价以文献计量为主,同行评议为辅,评价的标准、方法、指标和组织实施等都存在一些不足,以致出现了过度数量化、简单化、形式化,甚至偏离评价目标等问题,影响了学术界和社会对人文社科成果的正确认知和学术创新的积极性,阻碍了人文社会科学的繁荣发展。学术界广泛认为,评价机制不完善是造成上述问题的重要诱因,尤其在诸多机制中,以创新和质量为导向的管理控制机制的严重缺位和失效,更是当前亟需解决的问题。2011年《教育部关于深入推进高等学校哲学社会科学繁荣发展的意见》也指出:完善以创新和质量为导向的科研评价机制是建设国家哲学社会科学创新体系的重点任务之一。

国内外学者已对学术评价机制做出了一系列研究和思考。中国学者的相关研究可分为三类:(1) 总结和批判学术成果评价机制存在的问题,如刘明[1]系统梳理并批判了古今中外的学术评价制度的不足;不少学者也指出学术成果评价机制存在行政化、重量轻质、缺乏弹性、不符合人文社科研究规律等问题。(2) 探讨学术成果评价机制的问题症结,刘大椿[2]从哲学层面讨论了人文社科学术成果评价中的学术标准与非学术标准、基础研究与应用研究等矛盾关系;众多其他学者则借鉴信息学、政治学、公共管理学等理论,分析了评价中多数暴政、权威衰微和评价制度异化等现象的实质。(3) 分析学术成果评价的具体机制并提出完善策略,楚广兴等[3]初步研究了科技评价过程的质量控制机制;胡显章等[4]从国家创新系统角度分析了同行评议的约束机制;有些学者还提出了开展多元评价、加强规范同行评议、构建元评价机制等建议。

与中国不同,西方人文社科学术成果评价以同行评议为主,文献计量为辅。关于评价机制的典型研究有四类,也值得我们思考和借鉴:(1) 数量评价与质量评价的平衡机制,如Talib[5]认为科研评估必须权衡数量与质量;Moed[6]发现英国的科研评估经历了“注重数量,注重质量,再次注重数量”三个阶段。(2) 与科研资助挂钩的激励机制,英国科研评估计划(RAE)直接决定科研经费分配,芬兰教育部也建议建立这种基于绩效的拨款机制。(3) 政策导向的多元化评价机制,Mazlish[7]认为成果质量包括内部学术质量和外部社会质量;Astbury[8]从政策角度探讨了评价的机制和理论问题。(4) 探讨科研评价的消极影响,呼吁对评价机制进行改革,如Sikes[9]认为评价增加了学者的压力、改变了工作方式、影响了专业性,应通过改革降低这些负面作用;Bernard[10]发现功利化的科研评估使历史学家无法认真开展研究,改革势在必行。

可以看到,多数对人文社科学术评价机制的研究着重指出问题或分析成因,只有少部分学者提出了一些建设性观点;对评价机制的理论构建和实证研究,尤其是对创新和质量导向的学术成果评价管理控制机制的研究尚较为匮乏。事实上,学术评价机制的创新与学术创新同等重要[11]。为此,笔者以创新和质量导向为原点,对中国人文社科学术成果评价中应予以管理和控制的关键因素及其作用关系和内在机理等进行系统的理论思考,以期建立有效的评价管理控制机制,为完善评价体系、规范评价实践和支撑国家哲学社会科学创新体系建设提供参考。

(二) 研究框架及方法

“创新和质量导向的人文社科学术成果评价管理控制机制”(以下简称“评价管控机制”)是指:以创新和质量为导向,对人文社科评价体系的构成要素及其相互作用关系进行管控的内容、方式及过程。

图 1展示了本文的基本分析框架。其中,创新和质量导向是建立评价管控机制的目标和方向,要求评价体系的各要素均能引导和促进学术成果的创新和质量提升;评价体系的各要素是管控机制的管控对象,通过对要素及其存在问题的管理和控制,可使人文社科成果评价的创新和质量导向落到实处;关键管控维度是管控机制的具体内容,根据评价体系各要素与创新和质量导向之间的作用机理,调整评价体系各要素,使评价过程和结果能够筛选出创新性较强、质量较高的成果并给予恰当认可,减少甚至规避评价体系存在的问题。

图 1 评价管理控制机制的分析框架

其中,关键管控维度是本文探讨的重点,在此处对其内涵进行界定。由于人文社科成果评价是将评委头脑中的判断显性化的过程,与心理学量表的原理极为相似,因此本文借鉴心理学量表的信度和效度概念,将评价信度定义为:判断人文社科成果创新和质量过程中“随机误差”的多少,即当评价体系中某一因素发生变化时,评价结果的一致性程度;将评价效度定义为:评价过程和结果所反映出的人文社科成果创新和质量特征的有效程度。评价调和度的提出则着眼于人文社科学术成果评价中天然存在的诸多矛盾冲突[2, 18];由于人文社科学术评价具有较强的主观性,这些矛盾冲突不可能彻底消除,而只能通过协调甚至取舍达到平衡与和谐;评价调和度是指:以学术成果创新和质量提升最大化为目标,通过制定协调规则使评价中各类矛盾冲突达到平衡与和谐的程度。

本文将按照上述分析框架,通过理论和实践的上下对接,对评价管控机制应具备的功能、应控并可控的主要因素,决定评价创新和质量导向的关键变量及其相互作用机理等进行分析。在理论层面,通过分析学术评价创新和质量导向的内涵和影响因素等,明确该导向对评价信度、评价效度和评价调和度进行管控的内在要求;在实践层面,通过总结分析当前中国人文社科成果评价中各要素存在的问题,有针对性地确定对评价信度、评价效度、评价调和度进行管控的内容、方式和手段。

二、评价管控机制的创新和质量导向分析

评价具有重要的导向意义,明确导向是构建评价管控机制的首要问题。为贯彻落实党的十七届六中全会和《教育部关于深入推进高等学校哲学社会科学繁荣发展的意见》的精神,2011年下发的《教育部关于进一步改进高等学校哲学社会科学研究评价的意见》进一步细化阐述了人文社科成果评价的创新和质量导向,明确指出科学有效的学术评价必须以激发活力为根本,以提升质量为导向,以推进创新为重点。事实上,倡导学术创新与强调学术成果质量相辅相成,因为创新在本质上是一种质量价值;当数量价值被提升到决定性地位时,质量价值就注定会被忽视[11];只有在以质量为导向的评价中,才能有效倡导学术创新。

(一) 人文社科成果评价的创新导向

江泽民同志在1995年全国科技大会上的讲话指出:“创新是一个民族进步的灵魂,是国家兴旺发达的不竭动力。”根据资料,早在《南史·后妃传·上·宋世祖殷淑化》中就曾提到过,创新是创造新东西的意思,这一解释广泛适用于各类创新。熊彼特是国际上较早提出创新概念的学者,他于1912年在《经济发展理论》中从经济学角度提出,创新就是建立一种新的生产函数,在经济活动中引入新的思想、方法以实现生产要素新的组合。

学术创新是创新的重要内容之一。学术研究通过对命题真假的论证,追求认识世界、改变世界的普遍规律,对某一领域中专门的、系统的学问进行持续更新。创新是学术研究的内在要求和发展动力。墨子在公元前490年提出的“述而且作”的精神代表了中国关于学术创新的早期观点。针对人文社会科学领域,中国的“十二五”规划纲要将哲学社会科学创新提升到了国家发展战略的高度。1993年美国学者爱弥顿[11]在《知识创新:共同的语言》中,把知识创新界定为新思想产生、深化、交流并应用到产品(服务)中,促使企业获得成功,国家经济活力增强,社会取得进步;这一观点指出了学术创新对经济社会发展的作用,在国际上得到广泛认可。

① 本文认为“人文社会科学”和“哲学社会科学”两个概念内涵基本一致。

当代许多学者也对学术创新的内涵、外延、影响因素等问题进行了探讨。比如许红珍[12]认为,学术创新是在前人研究的基础上,通过对新资料的发掘、对新问题的探索、对已有理论的扬弃,产生新的学术观点、构建新的理论范式、推进学科理论发展和社会进步。詹先明[13]论述了建设学术共同体以及学术规范和学术批评对学术创新的重要作用。唐松林等[14]从波普尔批判理性主义出发,提出猜测和反驳是学术的基本方法,怀疑与批判是研究过程的本质,批判问题与容忍错误是推动学术创新的基本范式。朱旭东[15]、叶志雄[16]等分别从不同角度指出学术创新能力由洞察想象能力、综合交叉能力、知识谱系能力、反思批判能力、学术自主能力、合作分享能力等构成。叶险明[17]讨论了当前创新庸俗化加剧了学术泡沫和学术腐败,阻碍中国人文社会科学创新和繁荣发展的问题。学界还普遍认为,学术创新在外延上包括新理论、新方法、新材料、新发现等方面。高自龙[18]认为,人文社科成果的创新不仅包括提出以上方面的新内容,还包括对已有研究的改进,并特别指出,综述性研究的新概括也属于创新。

在倡导人文社科成果评价创新导向时,上述研究带给我们如下启示:第一,学术创新是学术研究的本质属性和内在要求,任何人文社会科学研究都必须创新,否则学术就无法进步,因此学术创新程度应该作为评价人文社科成果的首要标准和核心指标。第二,学术成果是否具有创新性以及创新程度如何与研究过程密切相关,因此在评价人文社科成果时,不仅应关注成果本身,还应关注学术研究的全过程,过程的规范性和科学性也应作为评价的重要内容。第三,人文社科成果创新不仅是学术活动,也具有经济性和社会性,因此人文社科成果的经济效益和社会效益也应作为评价的重要尺度,成果的用户有权对成果进行评价。第四,学术创新不是静态的、孤立的活动,一项成果往往既建立在已有研究基础之上,又为以后的研究奠定基础,不同成果通常在时间和空间上具有持续性和关联性,因此对于知识表述方式过于自由的人文社科成果来说,评价的重点和难点在于判断出成果有别于其他成果之处。第五,怀疑和批判是学术创新的出发点,对于大量使用思辨方法的人文社会科学而言更是如此,这就要求评价体系能充分包容有争议的成果,营造出自由宽松的、鼓励学者创新的学术环境。第六,学者既是学术创新的主体也是评价主体,通过成果和评价的“共生相长”提升学者的创新能力、充分发挥学术共同体的评价作用,是评价体系的重要功能。

(二) 人文社科成果评价的质量导向

根据当前评价中过分重视数量评价的状况,《教育部关于进一步改进高等学校哲学社会科学研究评价的意见》指出,要确立“质量第一的评价导向”,强化质量意识,严格遵循质量评价标准,推行代表作制度,正确使用文献计量数据。

探讨质量的基本内涵,是推进评价质量导向的逻辑起点。《质量管理体系基本原理和术语》指出,质量是“一组固有特性满足要求的程度”。这一定义通常能用于解释各个领域的质量概念。《辞海》[19]对质量的解释是:“(1) 产品或工作的优劣程度。(2) 量度物体惯性大小的物理量。”这一概念区分了产品和工作的质量与物理学质量的差异,显然本文所讨论的是前者。质量管理专家对质量的定义[20]可以概括为两个层面:第一层面是指生产的产品或服务可测量的特点符合一组固定的规格,这些规格通常以数字予以界定,独立于任何可测量的特点;第二层面是指有关产品和服务满足客户的使用预期或消费预期。

围绕质量形成的质量管理理论,广泛应用于许多领域的质量管理和控制活动中,尤其是生产和服务领域。现代质量管理理论经历了以三个主流理论为代表的发展阶段, 即质量检验理论、统计质量控制理论和至今仍处于主流地位的全面质量管理理论,体现出质量概念从“符合要求”向“追求卓越”的发展过程[21]

由上可见,尽管人们对质量的具体解释存在差异,但对质量内涵的理解大体一致。当把质量导向用于人文社科成果评价时,以上的阐述带给我们如下启示:第一,质量是实体的固有属性,任何人文社科成果都具有质量;同时质量属性又具有满足不同主体需求的相对性,因此在评价人文社科成果质量时,必须考虑成果的“用户”,如同行学者、社会群体等。第二,只要遵循科学的方法,质量是可以进行有效测量的;在测量人文社科成果质量时,不仅可测量成果是否满足或符合某种要求,也可以测量出成果的相对质量,即满足需要的优劣程度;相对质量的测量对于推动评价的质量导向,引导学者追求卓越、攀登学术高峰更为重要。第三,质量是一组特性,而不是单一的特性[22],因此在评价人文社科成果质量时,所遵循的评价标准和指标应是一个彼此关联的综合体系,按照单一标准或指标进行评价往往不能全面反映成果质量,标准和指标之间关系混乱也不利于恰当有效地反映出成果质量。第四,人文社科成果通常经历生产和应用过程,在对成果进行评价时,有必要对成果的生产、评估、推广实施全过程进行管理和控制,追求学术成果的效益最大化,这一点与创新导向不谋而合。

三、人文社科学术成果的评价要素及存在问题分析

对评价要素及其相互关系的正确界定是构建评价管控机制的重要前提。叶继元教授[23]对评价要素进行了较为系统的研究,指出合理的评价体系应由评价主体、客体、目的、标准及指标、方法和制度六大要素组成;评价主体中的学术共同体是评价主力,评价客体中的成果和人员评价是重点,评价目的是龙头和动因,评价标准与指标是核心,评价方法是手段,评价制度是保障。在此基础上,杨建林等[24]进一步认为合理的学术评价体系至少包含学术评价组织者、评价主体、评价客体、评价目的、评价标准、评价方式和评价制度等七大要素。

本文根据构建评价管控机制的需要,借鉴现有研究对人文社科成果的评价要素做出了微调和新的归纳解释,形成了图 2所示的结构:在特定的学术环境中,人文社科成果的评价主体按照评价的标准和指标,利用一定的方法工具,遵循相应的评价程序,对评价对象进行评价,其中标准指标居于核心地位,评价程序和方法工具居于辅助地位;评价理念目标对评价活动起到指导作用,管理政策是评价活动顺利开展的保障。

图 2 人文社科学术成果评价要素关系简图
(一) 理念目标

评价理念是指评价活动所遵循的基本思想、原则和要求,评价目标是指某项评价活动要实现的具体目标,通常是评价理念的具体化。在评价体系中,理念目标发挥提纲挈领的作用,理念目标若不明确、不正确甚至缺失,将直接影响评价活动的开展。在评价的理念和目标中体现创新和质量导向,是构建评价管控机制的出发点和前提条件。事实上,各类评价目标异化问题广泛存在于中国人文社科成果评价实践中[25]。比如,把最初用于解决图书馆利用有限资源选购重点优秀期刊问题的“核心期刊”作为评价论文质量的核心尺度时,评价的理念和目标就发生了异化,致使评价结果违背初衷。学术性与非学术性的矛盾,本土化与国际化等矛盾[2, 18]也需要通过进一步明晰人文社科成果的评价理念与目标进行调和。

(二) 标准指标

评价标准是用来评价被评对象的价值尺度,评价指标是评价标准的细化和具体化。评价的标准指标是评价体系的核心,受理念目标的指导,对评价结果的正确性起到关键作用。一般认为,人文社科成果的评价标准包括真理标准、价值标准、政治标准、可读性标准等。当前中国人文社科成果的同行评议中,通常将学术创新、学术价值、社会价值、难易程度、论证完备等作为评估指标[18],但在许多评价体系中都存在指标相互关系不清、权重分配不合理、指标体系僵化以致无法体现人文社会多样性等问题;在基层科研评审中,也常将是否发表在核心期刊、是否被知名杂志转载、是否受到各级别项目资助、是否获奖、发文数量及规模等作为评价指标,显然这些指标存在过分重视数量和外部特征、以致评价结果不正确之嫌。以上问题均不利于学术成果的创新和对成果质量的有效评价,亟需评价管控机制予以纠正。

(三) 评价程序

评价程序是指评价的流程、环节和相关规则,是确保评价理念目标得以正确实现,以及评价标准指标得到正确实施的重要保障。当前中国人文社科成果评价中,存在过程简单化、形式化,受到非学术性因素影响,评价公开不到位等问题,致使评价结果的不确定性增加,评价的科学性和评价结果公信力受到质疑。评价程序的不规范、不细化,也是造成评价理念目标无法实现、标准指标无法有效实施的主要原因。尤其是在不同时间或条件下实施相同的评价体系时,由于评价程序及其执行细则不明确,极易产生评价信度较低的评价结果。这种状况使对评价程序的管控机制进行深入研究成为迫切需要。

(四) 评价主体

评价主体是指评价的实施者,包括评价活动的组织者和对成果进行直接评价的评委两类。评价主体是评价标准指标的制定者和操作者,对评价结果具有重要影响。目前学界普遍认为,学术共同体应作为学术成果评价的核心主体,但事实并非如此,评价活动仍受到行政部门的干预和许多其他因素的不良影响。由于缺乏对评价主体资质和适用性的判断,“外行评内行”的情况时有发生。由于人情关系、利益关系和责任感不足等问题,评价角色的失范问题也较为严重。虽然许多人认为评价人文社科成果的社会价值时,最终用户也应作为评价主体,但实际上用户参与评价的案例非常少。如何确保合适的主体开展正确的评价是构建评价管控机制、确保评价效度的难点之一。

(五) 评价对象

评价对象即评价客体,包括人文社科研究形成的论文、专著、研究咨询报告、教材、工具书、资料、翻译、科普、创作作品或工艺品评价等成果。成果评价是开展人文社科学者、机构、期刊等评价的重要基础。可按成果形式、成果内容、所属学科、研究性质等不同标准对人文社科成果进行分类评价。如何进行分类评价,将影响评价主体的选择、评价标准指标和评价程序的确定等问题。科学的分类评价是确保“同类比较”的重要前提,《教育部关于进一步改进高等学校哲学社会科学研究评价的意见》也指出了对人文社科成果进行科学分类评价的重要性。由于人文社会科学学科范式复杂,分类评价显得更为重要。但当前中国对人文社科成果的分类评价对人文社会科学特征的体现还不充分,以致一些评价标准、指标和程序对所评成果不适用。可以说,在构建评价管控机制时需要格外关注分类评价。

(六) 方法工具

即评价中所使用的方法工具。目前文献计量和同行评议仍是评价人文社会科学成果的两种基本方法。前者着重对成果的形式评价,后者着重对成果的内容评价,但两者都在一定程度上体现出对成果的效用评价。针对每种方法还有更为细化的辅助方法,如德尔菲法可用于更好地搜集同行评议专家的意见,层次分析法有助于更科学地确定评价指标的权重分配,H指数则有利于更便捷地利用文献计量法评价学者和科研机构。评价工具包括同行评议评分表、网络评估软件等,常用于提高评价的效率和准确性。基于文献计量方法的“以刊评文”方法具有较强的间接性,同行评议方法则具有较强的主观性,但由于难以找到有效的替代方法,致使许多人文社科学者为了发表成果削足适履,阻碍了正常的学术创新和成果质量提升。同时,虽然信息网络技术已为学术评价提供了诸多便利,但智能型人文社科成果评价软件工具仍属缺位[18]。因此,构建评价管控机制时,有必要通过管控尽力规避现有方法工具的不足,促进评价的方法工具实现突破性创新。

(七) 管理政策

即有关管理部门制定的确保评价活动得以顺利进行、要求有关人员共同遵守的规程,是评价体系制度化的表现,内容涉及评价的理念、标准、方法,评审相关方的责权利,评审专家遴选,评价监督,评价结果应用,评审的公开、反馈和申诉等内容。有些管理政策具有强制性,有些则仅具有指导或建议性;有些管理政策在人文社科领域广泛适用,有些则仅适用于部门内部;有些管理政策覆盖评价要素的方方面面,有些则仅适用于部分评价要素;有些管理政策是针对人文社科评价活动专门制定的,有些则仅起到间接作用。良好的管理政策有利于确保评价活动的正确导向、高效率和有效性,营造出良好的学术环境。当前中国人文社科成果评价的管理政策比较零散,制度化和体系化还很不够,科学性和可操作性也有待提升,管理政策的缺失、混乱、不合理、过于利益化等是导致评价活动不尽如人意的重要原因之一。在构建评价管控机制时应重点利用管理政策理顺评价体系各要素之间的关系。

(八) 学术环境

学术环境是指人文社会科学领域普遍认同的学术精神、学术规范和学术行为等。不同国家、学科、时代的学术环境存在一定差异。当前中国人文社科领域的学术环境存在明显的急功近利、研究范式僵化、学术规范缺失等问题,甚至也出现了一定数量的学术不端和腐败现象。在评价学术成果时,学者之间互相利用、不当竞争、走形式、拉人情关系等情况也偶有出现。这样的状况影响了正常的学术研究和评价活动,也影响了学者之间的分工协作、相互交流和信任,对人文社会科学的创新和发展十分不利。这就要求评价管控机制必须发挥作用,营造更能促进学术创新和质量提升的学术环境。

综上所述,中国人文社科成果评价体系中的八个要素,均存在一系列阻碍学术创新和提升学术质量的问题。且这八个因素并不是孤立的,所涉及的问题也具有一定的共通性,例如:不同的评价主体在评价同一项人文社科成果时,常常会形成差异较大的结论;同一个评价主体在评价水平相近的人文社科成果时,有时也会得出大相径庭的结果。因此有必要综合考虑各评价要素,进一步抽象概括评价中的问题背后的规律,有的放矢地构建评价管控机制。

四、评价管控机制的关键管控维度和管控内容分析

评价管控机制的基本功能,是通过对评价要素中易发生问题的环节进行管理和控制,减少甚至规避问题,从而使评价活动达到促进人文社会科学创新和成果质量提高的目标。发现迫切需要进行管理和控制的维度和内容,是构建评价管控机制的核心问题。通过前文的分析可以发现,对评价的信度、效度和调和度三个维度进行管控集中体现出中国人文社科成果评价在理论和实践两方面的迫切需要。本部分将按照创新和质量导向的评价要求,着重分析三个管控维度的影响因素和作用机理,并概要阐述各维度的管控内容及其实现方式和手段。

(一) 对评价信度的管理控制

根据前文分析,评价体系的诸多问题,如评价程序不规范、操作细则不明确、评价主体角色失范等,都可理解为评价信度问题。在某一确定的评价体系中按照要求随机选择不同的评委对同一成果进行评价,但评价结果却不一致甚至差异较大,或者对于业界公认的优秀成果,在不同时间评出的结果波动过大等,都属于典型的评价信度问题。这种不一致的情况越多,说明评价的信度越低,评价结果越不可靠,长此以往,评价体系的公信力就会受到质疑。创新导向的评价要求对人文社科成果的创新较为包容,以便更好地促进创新;质量导向的评价要求对人文社科成果质量的测量尽可能准确,以便实现评价的公平公正。这两个导向都对评价信度提出了较高的要求。

因此通过对信度的管理控制,减少评价过程中的不一致,有利于激励创新性较强但还不够成熟的研究,提高对成果质量测量的精确程度。换句话说,对评价信度的管理控制旨在通过减少甚至规避评价中的“随机误差”,确保评价结果的一致性。即在其他条件不变,但评价的时间、环境、方法、工具、组织者、评委等某一因素发生变化时,通过管控确保评价结果的一致性和可信度。

评价信度问题主要涉及评价标准指标、评价程序、评价主体等要素,相应的管控内容及其方式和手段包括但不限于:(1) 针对标准指标要素:调整评价指标设置,使各项指标更全面地体现成果的学术创新性和质量,且逻辑上不交叉重复;优化指标的权重分配,提升指标的实测精确程度,加大创新指标的权重,使评价更充分地体现创新和质量导向。(2) 针对评价程序要素:运用统计方法控制评价结果的分布,帮助评委更准确地量化评价结果;对评价结果进行复查和采用流水作业等方式,确保不因评委的主观性错误或过于复杂的操作方式导致评价结果不准确。(3) 针对评价主体要素:遴选并培训同行评委,使评委能更好地理解和操作评价体系。

(二) 对评价效度的管理控制

如前所述,人文社科成果评价中的一系列常见问题,也需要通过对评价效度的管理控制予以规避和解决。如有时评价结果偏离评价目标,尽管所设置的评价体系旨在评价成果的创新程度和质量,但所设置的指标过于间接,致使数量评价代替了质量评价,甚至伤害学者创新的积极性。由于分类评价未能较好地贯彻实施,评价标准或指标并不适用于评价对象,社会价值指标在评价人文学科基础性研究成果时,其可操作性就往往令人失望。再者,评价结果的区分度过小,以致难以区分出被评对象优劣程度的情况也常常发生,不利于保证评价的公信力和引导学者进行持续创新。

以创新和质量导向对评价效度进行管理控制,旨在确保评价真正确实地测量评价对象在创新和质量方面的特性,且测量结果较为准确。效度包括:内部效度,如评价指标体系与评价目标的吻合程度;外部效度,如评价标准对评价对象的适用程度;测量效度,如评价工具能否恰当表达和量化评价结果,较好地区分出被评价对象的差异。

评价效度问题主要涉及评价的理念目标、标准指标、评价对象、评价程序、方法工具、评价主体、学术环境等要素,相应的管控内容及其方式和手段包括但不限于:(1) 针对理念目标要素:树立评价的创新和质量导向意识,统一人文社会科学界对评价导向的认识,推广创新和质量导向的科研管理政策。(2) 针对标准指标和评价对象要素:分类设置评价指标,针对不同学科和类型人文社科成果的特征,分类设置相应的评价指标,有利于提高评价体系对评价对象的适用程度。(3) 针对评价程序要素:设置标准化的评价原则,通俗地描述这些原则,有利于协调评价体系中各要素,促进预期评价目标的顺利实现;提高评价实测过程的难度,比如要求评委较为详细地描述出被评对象的质量,显然比仅要求评委对被评对象的质量进行程度选择,更能让评委认真对待评测过程。(4) 针对方法工具要素:调整文献计量数据统计方法,如对引文数量显著高于或低于同类研究的成果进行单独统计;调整同行评议打分表,使评价主体能够更为精确地量化表达出评委对评价成果质量的印象,比如21分量表就显著优于10分量表和5分量表[18]。(5) 针对评价主体要素:监督评价组织者、评委和成果作者之间的师生、亲属、利益等关系,通过评委和评价对象匿名和实名方法的有效结合,回避这些关系并得到更准确的评价结果.(6) 针对学术环境要素:营造创新和质量导向的学术环境。

(三) 对评价调和度的管理控制

人文社科成果评价结果引起诟病往往还因为评价活动本身存在与生俱来的矛盾冲突,比如理想完美性与现实可行性的矛盾[18],客观定量评价与主观定性评价的矛盾[2],本土标准与国际标准的矛盾等[2],不同评委对同一评价对象也可能产生不同甚至完全相反的意见,评价对象不认同被评结果的情况也较为普遍。这些矛盾冲突在评价创新性较强的成果时更容易发生。目前人们往往采取“亡羊补牢”的方式解决这些矛盾,即出现问题时临时讨论解决方式,但事实上,对这些问题进行及时有效的前端控制,即建立合理的评价调和度管控机制才是长久之计。

评价调和度问题旨在以创新和质量为基准,协调学术成果评价中的各类矛盾冲突。对评价调和度进行管理控制的重点是确定矛盾冲突的处理原则和措施。原则和措施的基本思路是“平衡”矛盾的主次方面。显然,为了确保创新和质量导向,评价调和度管控机制在“平衡”矛盾冲突时需坚持以下准则,即向有利于成果创新和质量提升的矛盾主要方面倾斜,为此势必需要降低甚至牺牲矛盾的次要方面,比如为了激励创新降低对论证完备程度的要求。

评价调和度问题主要涉及评价的理念目标、标准指标、评价程序、方法工具、评价主体等要素,相应的管控内容及其方式和手段包括但不限于:(1) 针对理念目标和标准指标这两个要素,重点需要明确国际化标准与本土化标准之间的矛盾,客观定量评价与主观定性评价之间的矛盾,行政要求与学术规范之间的矛盾等,当基于不同方法的评价标准或指标之间存在互斥或制约时,有必要对评价标准和指标体系进行反复论证后再投入使用。(2) 针对评价程序和方法工具这两个要素,重点需要平衡理想完美性与实际操作可行性之间的矛盾,应根据实际情况对不同方法、工具进行选择、取舍和搭配,针对矛盾冲突时常发生的环节细化评价程序的处理细则。(3) 针对评价主体要素,重点需要协调评价主体间的非共识性意见,并细化发生冲突时的解决方法。

五、结语

中国现行人文社科学术成果评价体系存在许多问题,严重制约着人文社会科学的健康发展,本文基于当前相关管理部门和学界普遍倡导的创新和质量导向,通过分析和归纳将评价管控机制的关键管控维度概括为评价的信度、效度和调和度三项,并从理论上初步构建了评价管控机制的内容框架。然而,无论在理论上还是实践上,中国人文社科成果评价管控机制的构建仍然任重而道远。本文所提出的框架涉及到大量人文社科成果评价的细节问题,尚有待评价领域甚至全体人文社会科学工作者进行长期、深入的探讨。

参考文献
[1] 刘明. 学术成果评价制度批判[M]. 北京: 长江文艺出版社, 2006.
[2] 刘大椿. 中国人文社会科学评估问题之审视[J]. 重庆大学学报:社会科学版, 2009(1): 54–59.
[3] 楚广兴, 李帮义. 科技评价过程的质量体系管理控制机制及控制策略研究[J]. 科学学与科学技术管理, 2006(3): 40–43.
[4] 胡显章. 国家创新系统与学术成果评价[M]. 济南: 山东教育出版社, 2000.
[5] TALIB, AMEEN ALI. Simulations of the submission decision in the research assessment exercise:the 'Who' and 'Where' decision[J]. Education Economic, 1999(1): 39–51.
[6] MO ED, HENK F. UK research assessment exercises:Informed judgments on research quality or quantity?[J]. Sientometrics, 2008(1): 153–161.
[7] MAZLISH B. The quality of 'The quality of science':An evaluation[J]. Science, Technology & Human Values, 1982(7): 32.
[8] ASTBURY BRAD. LEEUW, FRANS L. Unpacking black Boxes:Mechanisms and theory building in evaluation American[J]. Journal of Evaluation, 2110, 31(3): 363–383.
[9] SIKES, P AT. Working in a 'New' university:in the shadow of the research assessment Exercise?[J]. Studies in Higher Education, 2006(5): 555–568.
[10] BERNARD G W. History of the research Assessment Exercises[J]. Oxford Review of Education, 2000(1): 95–106.
[11] AMIDON D M. Knowledge innovation:The common language[J]. Jounal of Technology Studies, 1993, 19(2): 2–8.
[12] 许红珍. 学术创新和学术评价机制创新的探索与思考[J]. 华东师范大学学报:哲学社会科学版, 2009(3): 66–71.
[13] 詹先明. 学术共同体建设:学术规范、学术批评与学术创新[J]. 江苏高教, 2009(3): 13–16.
[14] 唐松林, 王静. 波普尔批判理性主义视域中的学术创新[J]. 中国高教研究, 2007(3): 27–31.
[15] 朱旭东. 论大学教师学术创新力基础内涵[J]. 比较教育研究, 2011(7): 1–6.
[16] 叶志雄, 李娜. 论大学教师学术创新力的基础—学术批判反思能力[J]. 比较教育研究, 2011(7): 26–30.
[17] 叶险明. 学术创新与"学术泡沫"[J]. 哲学研究, 2002(8): 24–26.
[18] 高自龙, 杨红艳. 学术评价:理想与现实之间的优化选择[J]. 江汉论坛, 2011(11): 124–129. DOI: 10.3969/j.issn.1003-854X.2011.11.025
[19] 辞书编辑委员会. 辞海[M]. 编印本. 上海: 上海辞书出版社, 1980: 270.
[20] RW霍耶, 布鲁克BY霍耶. 何谓质量—世界八位著名质量专家给质量定义[J]. 中国质量技术监督, 2002(1): 52–54.
[21] 章帆, 韩福荣. 质量生态学研究2—质量概念与质量管理理论的演化[J]. 世界标准化与质量管理, 2005(4): 29–32.
[22] 林永柏. 关于高等教育质量概念的界定[J]. 教育科学, 2007(12): 32–36.
[23] 叶继元. 人文社会科学评价体系探讨[J]. 南京大学学报:哲学·人文科学·社会科学, 2010(1): 97–160.
[24] 杨建林, 朱惠, 宋唯娜, 等. 系统论视角下的学术评价机制[J]. 情报科学, 2012(5): 670–674.
[25] 高军, 迟爽. 我国学术成果评价制度的异化研究[J]. 高校教育管理, 2008(3): 31–37.
图 1 评价管理控制机制的分析框架
图 2 人文社科学术成果评价要素关系简图
人文社科成果评价管控机制的理论思考—以创新和质量为导向
杨红艳