編者按:近期美國教育界掀起一個顛覆性的改革與討論,由逾百所美國頂尖私立高中組成的MTC聯盟(Mastery Transcript Consortium)推出了一個全新的學生評價系統——素養成績單(Mastery Transcript),
與傳統的成績單相比,該系統不打分、不評級,只是持續追蹤、記錄、評估學生8項能力,目前已獲美國大學申請系統
Coalition for Access,Affordability and Success的支持。
MTC聯盟表示,未來素養成績單評價模式會擴展到公立中學,全面改寫美國大學的錄取方式。
這個新的學生評價系統是否會完全取代標準化考試成為美國高校錄取的依據?這個評價系統對我國高校招生有哪些啟示?為此,我們特別邀請專家圍繞高校招生模式展開筆談,同時歡迎廣大專家學者就此問題展開更廣泛的討論。
作者:王曉平,美國愛荷華州教育部,教育研究與評估高級顧問;
齊森,美國華盛頓蓋勞德特大學原研究員;
謝小慶,北京語言大學教育測量研究所原所長,中國教育學會統計測量分會副理事長,研究員,博士生導師。
原文刊載于《中國考試》2018年第3期第1—4頁。
摘要:美國高校招生無統一模式,標準化考試以及新的測量模式與方法都可能成為美國高校錄取的依據。
SAT和ACT成績從來不是美國高校錄取的唯一依據,由美國頂尖私立高中組成的MTC聯盟推出的高校招生“新模式”并非要取代SAT和ACT考試,而是為了改進高中的學生評價系統,美國的高校招生不大可能出現革命性的變化。
中國需要借鑒美國高校招生中淡化分數、淡化學科的嘗試,探索符合中國國情的考試評價方式,以此引領基礎教育改革由知識傳授轉向能力發展。
關鍵詞:高校招生;標準化考試;考試評價;考試招生制度改革
2017年5月10日,由逾百所美國頂尖私立高中組成的MTC聯盟(Mastery Transcript Consortium)正式推出了一種新的學生評價體系——“新模式”(A New Model)。
“新模式”目前已獲幫助申請者擇校的美國“入學、資助以及成功聯盟”(Coalition for Access, Affordability and Success,CAAS)的支持。
CAAS的用戶包括哈佛大學、耶魯大學、普林斯頓大學等80余所美國著名高校。
“新模式”的發起人為全美排名前25的俄亥俄州霍肯高中的校長Scott Looney,他同時也是MTC聯盟發起人。
他于2016年3月在美國私立學校協會年度會議上首次提出自己的構想,很快吸引到不少頂級私立高中的響應。
“新模式”包含兩個突出特點:第一,沒有分數,沒有級別,只是持續追蹤、記錄、評估學生的8項能力,報告學生在8項能力上的“掌握學分”(Mastery Credits),用描述性的評價取代分數評價,并配以直觀的放射圖說明。
第二,成績報告與課程脫鉤,在學生的成績報告中沒有課程、科目的名稱,僅僅包含學生的“掌握學分”和相關描述。
SAT和ACT是美國現行的“高考”。
有人說,“新模式”將逐漸取代SAT和ACT,成為美國大學錄取的新依據。
這種可能性有嗎?
美國高校招生不可能出現革命性變化
在美國,標準化考試SAT、ACT僅是美國大學招生的參考依據,既不唯一,也非重要依據。
在美國考試行業的行業標準中規定:在高利益相關(high stakes)考試中,在將考試分數作為升學、安置依據時,不能僅僅依據考試分數作出決策,必須同時參考其他方面的證據。
對此,早在1985年,由美國教育研究協會(American Educational Research Association,AERA)、美國心理學會(American Psychological Association,APA)和美國國家教育測量學會(National Council on Measurement in Education,NCME) 共同制定的《教育與心理測驗標準》(Standards for Educational and Psychological Testing)就作出明確規定,
2014年修訂版的表述是:“在教育環境中,不能僅僅憑一個單獨的測驗分數去作出那些可能對學生產生重要影響的決定或定性,決策還需要依據其他的相關信息。
”這既是美國考試行業的規定,也是美國教育界以及整個美國社會的共識。
美國的大學招生并無統一模式,非常個性化,各個大學具有自己不同的特點,對標準化考試的重視程度也不同。
各個大學以及下屬的各學院、各系、各專業招生的標準與評估方式都有可能不同。
大學、學院、系、專業通常都有一個自己的招生計分算法,按照不同的加權,計算得到錄取指數(Admission Index)。
通常,計分方式屬于內部掌握,不會對外公布。
總體講,在大學招生中最看重的還是報考者在中學的平均分數(Grade Point Average,GPA)或平均等級(Rank)。
此外,還會考慮大學先修測試(Advanced Placement,AP)成績、學術活動獲獎、參與社會公益活動、文藝體育特長、教師推薦信、發表作品、自我陳述、面試等方面的信息。
許多大學要求申請者提交的申請材料包括高中所學所有課程的詳細列表和成績單。
美國有多種層次、多種類型的大學,可以滿足普通大眾和精英人才的多種需求。
個人只要愿意讀大學,總能找到適合自己的學校,不會出現“一考定終身”的現象,某個考生即使由于考試成績或經濟原因而進入了社區大學,只要肯努力,有很多機會可以最終考入自己心儀的名校。
近些年,報考SAT和ACT的人數不但沒有下降,而且每年都在增加,這是由于根據奧巴馬總統在2015年簽署的《每一個學生成功法案》(Every Student Succeeds Act),一些州將SAT和ACT成績用于教育問責(Accountability)。
在美國,對SAT等標準化考試的批評由來已久,用更有效、可靠的評價方式來取代標準化考試的呼聲一直不斷。
從20世紀90年代初開始,在美國教育界就興起了一股表現性評估(performance assessment)、真實性評估(authentic assessment)和檔案袋評估(portfolio assessment)的潮流。
不少人主張用一些更有效的評估辦法取代標準化考試,主張用一個覆蓋較長時間段的形成性評估(formative assessment)取代某一特定時間點的終結性評估(summative assessment)。
在成績報告方面,21世紀初美國各個主要的教育測量機構就開始注意避免向分數的使用者(包括學生、教師、家長、招生招工機構)僅僅提供一個“總分”,而是向測驗的使用者提供描述性成績報告(descriptive scoring)。
為此,廣泛開展了認知診斷(cognitive diagnosis)方面的研究。
基于認知診斷的思路,獲得相同總分的人可能具有不同的認知結構和學習路徑。
認知診斷研究將認知心理學和心理測量學結合,借助現代的統計方法和計算機技術,對學生的認知結構和認知過程進行個性化的診斷分析,向測驗的使用者提供更豐富的反饋信息,對進一步的學習和教學提出更具體、更有針對性的建議。
認知診斷過程可以發現每個學習者的知識掌握狀況,發現每個學習者的認知結構,發現每個學習者不同的學習路徑,并提出幫助和補救建議,如SAT就采用了描述性計分和成績報告。
只有借助現代的統計工具、高速計算機和網絡環境,才可能根據每個考生在考試中的反應作出認知診斷。
今天,已經發展出多種認知診斷的數學模型,包括規則空間模型(Rule Space Model)、統一模型(Unified Model)、融合模型(Fusion Model)、DINA模型(Deterministic Inputs,Noisy“And”Gate Model),等等。
描述性記分的關鍵步驟是對測驗所要測量的能力進行特征定義,定義這種能力所具有的屬性,詳細描述學習的進程,界定不同的認知模式和不同的問題解決路徑。
當今,計算機技術和互聯網正在改變著世界,未來互聯網將沖擊傳統的教育和心理測量領域。
可以展望,未來的招生評價將不再是基于一次性考試的評價,也不再是基于某一時間橫斷面的信息,借助于大數據和云資源,招生機構可以收集到考生各方面的資料,從而獲得申請者全方位的、立體的信息,這些信息無疑將成為決策更可靠的依據。
從1916年約翰·杜威發表《民主主義的教育》以來,教育觀念的變革已經持續了百余年。
在快速變化的新時代,教育的變革必須與社會的變革相適應,尤其是在移動互聯時代。
今天,面對鋪天蓋地奔涌而來的信息大潮,重要的已經不再是“獲取”信息,而是對信息進行“過濾”和“篩選”。
由于傳統和習慣的力量,重視知識傳授而忽略能力發展是各國教育的痼疾。
與以往相比,發展能力在今天變得更加重要。
在美國高校招生的“新模式”中,彰顯了繼續淡化知識傳授和強化能力發展的努力。
可以展望,伴隨技術的發展,不僅知識的存儲、檢索和提取工作將被機器所取代,甚至一部分知識的分類和整理工作也會被機器所取代,人的注意力將更加集中于對知識的評價和運用,集中于運用知識解決實際問題。
Looney校長倡議采用“新模式”的初衷并非要用“新模式”取代SAT和ACT標準化考試,而是為了改進高中的學生評價系統,為每個學生提供更有針對性、更個性化的反饋信息,提高學習的效率。
盡管SAT等標準化考試也開始采用描述性計分,但這些考試仍然主要是預測選拔性考試,而不是認知診斷性考試。
今天,認知診斷性考試在實踐中主要用于幫助教師了解學生,以便因材施教。
此類測驗模式不適合也并沒有被全面引入大學招生考試。
從上述對美國招生“新模式”的分析可以看出,“新模式”主要是為了改進和完善學校的評價系統,是改進教育種種努力的自然延續。
當然,這種模式也會對改進大學招生產生促進作用。
考慮到“新模式”需要較多的人力物力投入,考慮到“新模式”對教師和教育管理人員有更高的要求,我們估計,至少在未來的10年間,“新模式”將僅僅被應用于少數私立學校,并且也主要用于一些尖子生的錄取,被廣泛應用于公立學校的可能性不大,更不可能取代SAT和ACT等標準化考試。
但是,伴隨基于大數據的新型形成性評價系統的建設,SAT和ACT等標準化考試在大學招生中的比重有可能越來越小。
盡管30年來對SAT等標準化考試的批評一波未平一波又起,盡管20多年前在美國就興起了表現型評估和真實性評估的熱潮,但標準化考試在大學招生中的作用并未削弱。
出現這種情況,緣于三個因素:其一,標準化考試是一種比較經濟、便宜的評價方式,而表現型評估則花費高昂;其二,盡管就一個班級或一所學校的學生而言,表現型評估具有更高的效度,
但是在不同學校、不同地區之間卻缺乏可比性,也較難保證評估的公平性;其三,SAT等標準化考試一直在根據大學和高中的要求進行改進,努力滿足大學和高中的需求。
未來這三個因素會繼續存在,因此,美國的大學招生不大可能出現革命性的變化。
中國需要更堅定地推進考試評價制度改革
我國從1977年恢復高考以來,雖然已經在考試科學化方面取得了顯著成績,但與社會發展的要求之間還存在一定差距。
中國的基礎教育于2001年啟動“新課程改革”,17年來,為了挽救“小范進”們,中小學教師付出了許多心血,承擔了種種壓力,在他們的努力下,我國基礎教育已經發生了明顯變化,
中小學課堂已經出現了可喜變化,“小組學習”正在取代教師的“獨角戲”和“一言堂”,“能力發展”正在取代“知識傳授”,思維訓練正在取代“死記硬背”。
但是,積極從事“課改”的教師、校長和教育局局長們長期面臨著一個困惑:如何評價新的教學方法達到了更好的教學效果?教學改革的效果如何體現?
顯然,傳統的“以分數為緯、以學科為經”的評價方式已經不足以反映教學改革在發展學生核心勝任力和提高學生思維水平方面所取得的成效,不足以反映教學改革在提高學生核心素養方面的成效。
因此,迫切需要加速考試評價的科學化進程,美國高校招生“新模式”中淡化分數、淡化學科的嘗試,值得我們借鑒和參考。
好在2014年啟動的新一輪高考綜合改革已經邁出了一步,未來的路還很長,任務還很艱巨,需要全社會轉變觀念,需要考試評價研究工作者提出符合中國國情的評價技術和方法,在吸收借鑒美國教育同行經驗的基礎上,堅定不移地推進中國的考試評價制度改革。

? 2025. All Rights Reserved. 滬ICP備2023009024號-1