评价理论和技术还需突破
教育质量评价改革,是一个宏大而深刻的系统工程,除了思想、理念、理论、技术等突破外,还需要一个漫长的实践修正和积累期。路漫漫其修远兮,吾将上下而求索,这句话可能是对评价改革最好的描述。我国2001年的《基础教育课程改革纲要(试行)》和2002年《教育部关于积极推进中小学评价与考试制度改革的通知》及相关文件,给出了“三维”学科教育目标和学科课程标准,学科教育目标不再是过去的“双基”目标。2013年《意见》明确提出:“将定量评价与定性评价相结合,注重全面客观地收集信息,根据数据和事实进行分析判断,改变过去主要依靠经验和观察进行评价的做法。将形成性评价与终结性评价相结合,注重考查学生进步的程度和学校的努力程度,改变单纯强调结果不关注发展变化的做法。将内部评价与外部评价相结合,注重促进学校建立质量内控机制,改变过于依赖外部评价而忽视自我诊断、自我改进的做法”及“对评价内容和关键性指标进行分析诊断,分项给出评价结论,提出改进建议,形成学校教育质量综合评价报告。综合评价报告要注重对学校优势特色和存在的具体问题的反映,不简单对学校教育质量进行总体性的等级评价”的要求。这些要求清晰地指向了形成、过程、诊断、增值等评价方向。这对现有的测量、统计分析、评价技术的研发提出了很大的挑战。显然,依靠单一的测量与评价理论方法、及单纯依靠传统的标准测验理论与评价方法,已难以胜任。传统的标准测验理论将所测的心理特质视为一个心理学意义并不明晰的“统计结构”,目的在于从宏观层次给个体一个整体的评估。无论是经典测量理论还是项目反应理论及概化理论,存在的共同缺陷是,把所测心理特质当作一种纯“统计结构”,忽视对考生作答过程的考察,计量时只注重作答结果,忽视心理特质的实质内容,对“测什么”和“为什么”的问题却不能够很好地解决,也就无法了解个体解答测验的心理加工成分、策略、所需知识结构等内部心理机制,不能确定个体的强点和弱点。因这种缺陷和局限,就需要引入相应的测量理论和技术进行补充。我们需要引入能够解决“测什么”和“为什么”的理论——即实现对个体知识结构、加工技能或认知过程的诊断评估;需要引入多维项目反应理论(即MIRT),把传统项目反应理论从单维发展到多维、从线性发展到非线性,更深入地了解被试;需要引入质性评价理论,考察学生学习的整体情况,以及在具体情境中运用知识的能力,问题比较开放或为非结构的,甚至难以找到标准答案。要求学生、教师、家长和同学共同参与评价过程,评价方法是动态的,多元的和情境化的。所以就学业评价而言,测量与评价理论、标准、技术和方法的设计需要思考在以下几个方面实现突破:理论突破:要有机整合国际知名教育理论以及教育学、心理学等学科最新研究,建立多元、多维的测量、评价技术模型。技术突破:要在试题赋分、计分和统计分析上,依据认知与思维等发生过程,设计新的多元、多维的分数结构。应用突破:在成绩报告方面,应学习和借鉴国际大型标准化测试的报告系统,不仅能提供数据多元、多维、多重比较结果,而且能提供面向不同群体的数据报告。中小学生综合素质评价是本次教育评价改革实验的重点内容之一,也是难题之一。综合素质评价发端于英国学者提出的质性评价研究。质性评价倡导通过自然的调查,全面提示和描述评价对象的各种特质,以彰显其意义,达成理解,主张评价应全面反映教育现象的真实情况,为改进教学提供真实可靠的依据。也就是说,评价应关注学生的学习过程,及时发现问题加以纠正。质性评价的主要特点:一是自然性,质性评价必须在自然的情境下进行,对评价对象在他的“学习世界”中的学习过程情况进行评价;二是解释性,评价需要在自然的情境中进行,评价者了解评价对象在自然情境中的学习情况,即学习态度、学习思想、学习动机、思维水平等各种特质。质性评价的方法,源自解释主义哲学,形成于建构主义理论模型和评价模式。经过三十多年发展,已积累了丰富的实践经验和体系。在这方面美国已有相当丰富的经验值得借鉴,其主流有两大类模式和方法——真实性评价和表现性评价。如以“档案袋”评价法为代表的真实性评价和表现性评价,已成为美国教育评价和人才选拔中不可或缺的方法。通过对比分析我国当前学生综合素质评价领域中存在的问题,本次评价改革中,就学生综合素质评价而言,要考虑解决以下几方面难题:如何界定中小学生综合素质及其评价的概念;构建中小学生综合素质评价的理论体系及模型;健全和完善中小学生综合素质评价的指标体系;健全和完善中小学生综合素质评价的测量与计量标准;健全和完善中小学生综合素质的评价标准;开发中小学生综合素质评价的评价工具;制定中小学生综合素质评价的工具操作标准;改进中小学生综合素质评价的结果呈现方式;建立中小学生综合素质评价的结果解释及应用系统;设计中小学生综合素质评价实验推广模式;设计中小学生综合素质评价公信力保障系统。标准化考试(发展潜能评价、能力测试),作为人才评估与选拔的核心手段之一,也是本轮评价改革中需要解决和突破的重点难题。在国家招生考试改革中规定“转变过去知识型考试为能力型考试,考察学生分析解决问题的能力和应用实践能力”,这不但对统一考试给出了明确界定,也对教育评价提出了清晰要求——给出学生能力发展评价。国际的选拔性考试,一般属于倾向性(预测性、发展性)考试,这与中国过去的选拔性考试(成就性测验)完全不同。而我国教育改革所指向的“分析解决问题的能力与应用实践能力”测试,则与目前欧美主流国家的大型标准化考试在目的、内涵上基本一致。2013年《意见》以及《指标框架(试行)》中明确提出“潜能发展”这一关键指标,要求对“学生在某些方面表现出的突出素质和进一步发展的能力”进行评价──即发展潜能评价。国外对学生发展潜能的测试较为普遍,其内容大部分都涉及语言、言语、空间(图形)、数字的理解和推理、判断。发展潜能评价主要是以人才培养为目标,通过测试学生潜在的能力,提供个体不同方面能力发展的状况,使学生客观地了解自己能力的特点,帮助学校或老师鉴别学生的学习能力、诊断学习中的问题,从而预测其能力发展的倾向或类型,为学生学业、职业生涯规划提供依据和参考,为制定合理的人才培养计划提供指导。无论是基于智力理论的潜能测试,还是基于多元智能理论的潜能测试,在我国于理论研究和技术研究上都很薄弱,尤其缺乏长期实践积累。这对这轮评价改革中的发展潜能评价的研究与应用提出了挑战。教育质量评价改革,是一个宏大而深刻的系统工程,除了思想、理念、理论、技术等突破外,还需要一个漫长的实践修正和积累期。路漫漫其修远兮,吾将上下而求索,这句话可能是对评价改革最好的描述。作者:张勇
图片来源:网络
内容来源:《教育评价改革反思与再认识》
转载:第三方评价会员村(ID:edudsfpj)
文章有删减
1. 优学云测评推出培训机构个性化教学解决方案
2. 优学云测评推出中小学校个性化教学解决方案
3. 优学云测评推出招生平台流量提升方案
4. 优学云测评推出企业人才发展平台解决方案——人才库管理
5. 优学云测评帮助个性化教育成为现实
优学云测评精选的每一篇文章都会注明来源和作者(除非找不到),文章版权归原作者所有,若有侵犯权益,请联系我们删除。本文所述内容仅代表作者观点,不代表优学云测评立场。对于本文以及其中全部或者部分内容、文字的真实性、完整性、准确性和合法性本公众号不作任何保证或承诺。