近日,在“第三屆元宇宙教育前沿峰會”上,國家職業(yè)教育指導(dǎo)咨詢委員會委員、北京師范大學(xué)教育學(xué)部教授趙志群以《職業(yè)教育學(xué)習(xí)成果評價(jià)及其數(shù)字化展望》為主題發(fā)表演講。趙志群指出,合理的學(xué)習(xí)評價(jià)要體現(xiàn)黨和國家的教育方針,尊重和體現(xiàn)學(xué)生的個(gè)體差異,激發(fā)學(xué)生努力實(shí)現(xiàn)自身的價(jià)值。
(資料圖片僅供參考)
(以下根據(jù)嘉賓演講實(shí)錄編輯整理,全文有刪減)
學(xué)習(xí)成果評價(jià)也叫學(xué)業(yè)評價(jià),是指以教育教學(xué)目標(biāo)為依據(jù),運(yùn)用恰當(dāng)有效的工具,系統(tǒng)收集學(xué)生在學(xué)習(xí)過程中認(rèn)知行為變化的信息和證據(jù),根據(jù)一定的標(biāo)準(zhǔn)對學(xué)生的知識、技能和能力水平做出客觀衡量和科學(xué)判定的過程。
合理的學(xué)習(xí)評價(jià)要體現(xiàn)黨和國家的教育方針,尊重和體現(xiàn)學(xué)生的個(gè)體差異,激發(fā)學(xué)生努力實(shí)現(xiàn)自身的價(jià)值。相較于普通教育,職業(yè)教育的學(xué)習(xí)成果評價(jià)更加復(fù)雜,不僅要向普通教育一樣滿足促進(jìn)學(xué)生生涯發(fā)展的教育性要求,同時(shí)也要迎合勞動力市場的功利性需求。
教育部曾作過一個(gè)調(diào)查。我們一般認(rèn)為技能大賽成績越好的學(xué)生技能和能力越好,將來發(fā)展也越好。但是跟蹤調(diào)查發(fā)現(xiàn),某項(xiàng)技能大賽成績好的選手綜合素質(zhì)反而低,而且這種劣勢在工作若干年后表現(xiàn)更為明顯。也就是說,一些技能大賽沒有反映企業(yè)的關(guān)鍵需求。這盡管不是普遍現(xiàn)象,但是反映出的問題卻很嚴(yán)重,即學(xué)習(xí)結(jié)果評價(jià)方式一定要關(guān)心評價(jià)技術(shù)和方法的科學(xué)性。
學(xué)習(xí)成果評價(jià)不是出一道試題那么簡單,正如上圖漫畫中老師出的題目:跳到樹枝上大象很發(fā)愁,但猴子很開心。但大象一定不如猴子嗎?那可不一定。要想找到一種方式把猴子和大象的優(yōu)缺點(diǎn)都考查出來,需要科學(xué)的評價(jià)理念和評價(jià)方法。
職業(yè)教育學(xué)習(xí)成果評價(jià)主要是對學(xué)生職業(yè)素質(zhì)、能力和技能進(jìn)行評價(jià),其方法有兩大類。一類是傳統(tǒng)的考試,考試的特點(diǎn)是有對錯(cuò)之分;另一類是職業(yè)能力測評,它的特點(diǎn)是沒有對錯(cuò)之分,只有水平高低之分。例如我們不能評價(jià)一位老師上課能力是對還是錯(cuò),只能說上課能力水平的高或低。
還有一個(gè)重要特點(diǎn),考試反映的是某種標(biāo)準(zhǔn)的效度。如教學(xué)標(biāo)準(zhǔn)、技能標(biāo)準(zhǔn)或者課程標(biāo)準(zhǔn);能力測評反映職業(yè)的效度。這兩種方式各有所長,互為補(bǔ)充,無法相互替代。
傳統(tǒng)的技能考試采用“知識+實(shí)踐技能”考試方式,知識考試通過筆試進(jìn)行,實(shí)踐技能考試主要通過現(xiàn)場或模擬操作觀察進(jìn)行評分。傳統(tǒng)技能考試有很大的技術(shù)局限性。例如奧運(yùn)會跳臺跳水,10個(gè)裁判評分,去掉最高和最低分后采用平均分。也就是說,代表世界最高水平的裁判對標(biāo)準(zhǔn)動作的技能評分都是不一樣,為了公平只能取去掉最高和最低分后的平均分。大規(guī)模的職業(yè)技能考試能做到絕對公平嗎?這不太可能。因?yàn)槿绻雽?shí)現(xiàn)高質(zhì)量的技能評價(jià),人員、時(shí)間等費(fèi)用會高得讓人無法接受。
當(dāng)前,人類工作活動的復(fù)雜程度越來越高,技能的內(nèi)涵已經(jīng)發(fā)生了深刻的變化,尤其是隨著心智技能的作用越來越凸顯,采用觀察法進(jìn)行評價(jià),其信度、效度和區(qū)分度無法得到保證,即傳統(tǒng)的技能考試無法保證評價(jià)的質(zhì)量。
隨著社會的發(fā)展,對技術(shù)技能型人才的素質(zhì)要求也發(fā)生了變化。根據(jù)“職教20條”的描述,現(xiàn)代社會的技能是一種綜合能力。未來對簡單重復(fù)性的操作技能需求會越來越少,因?yàn)闄C(jī)器會比人類做得又快又準(zhǔn)確。未來人類要做機(jī)器不能做的事情,需要的技能越來越復(fù)雜、綜合,這就是綜合能力。
這種要求體現(xiàn)在世界技能大賽上,這可能是世界上水平最高的技能評價(jià)。按照世界技能大賽的理念,要想評價(jià)出一個(gè)參賽選手技能水平高低,僅憑一兩道簡單的封閉性題目是不可能的。選手需要兩至三天時(shí)間完成復(fù)雜的、開放的綜合性題目,由此評價(jià)選手解決問題的能力、學(xué)習(xí)能力和創(chuàng)新能力,因?yàn)檫@里有1/3的新知識和技能是要“現(xiàn)學(xué)現(xiàn)賣”的。這里的時(shí)間、設(shè)備和組織成本都很高。因此,所以我們必須尋找其他方式補(bǔ)充技能考試的不足,那就是職業(yè)能力測評。
職業(yè)能力測評和考試的區(qū)別在于,它不是評價(jià)背會了多少知識,有多少操作技能,而是評價(jià)應(yīng)用知識和技能解決實(shí)際問題的能力。能力測評有兩種范式,一種是質(zhì)性評價(jià),一種是量化評價(jià)。
實(shí)踐中的職業(yè)能力測評更多采用量化和質(zhì)性相結(jié)合的混合式方法,它評價(jià)學(xué)生在職業(yè)工作和生涯發(fā)展中所需要的知識和技能,而不是考背會了多少知識,關(guān)注考生在實(shí)際工作情境中是否能夠創(chuàng)造性地運(yùn)用專業(yè)知識和技能解決問題的能力。能力測評不是現(xiàn)有考試或技能競賽的替代,而是補(bǔ)充。它對技術(shù)的要求較高,要想實(shí)現(xiàn)高質(zhì)量的測評,需要精心控制整個(gè)評價(jià)過程。
職業(yè)教育界對大規(guī)模職業(yè)能力測評有強(qiáng)烈的訴求,因?yàn)椋浩髽I(yè)需要了解員工或求職者的職業(yè)能力;教育部門關(guān)心每個(gè)學(xué)校培養(yǎng)的學(xué)生水平如何;院校要監(jiān)測學(xué)生的發(fā)展情況;一線老師需要科學(xué)的能力模型和能力工具,幫助分析教學(xué)設(shè)計(jì)和實(shí)施中的問題;國際比較研究需要大規(guī)模職業(yè)能力測評提供實(shí)證基礎(chǔ)。
開展科學(xué)的能力測評存在很多困難,比如各地區(qū)之間的差異很大,專業(yè)太多,技術(shù)更新太快等。要想進(jìn)行科學(xué)的能力測評首先得建模,其能力模型必須符合現(xiàn)代職業(yè)教育理論,包括心理學(xué)、教育學(xué)、社會學(xué)等主流認(rèn)知。在能力模型基礎(chǔ)上才能建立評價(jià)模型、確定指標(biāo)、出題和開展評價(jià)。能力測評方案的開發(fā)一定要有扎實(shí)的理論基礎(chǔ)。
上圖這個(gè)三維模型是COMET職業(yè)能力模型。
圖中第一個(gè)維度是能力水平,即能力要求。能力最低水平為名義能力,意味著不及格;及格后首先要滿足崗位的要求,然后滿足整個(gè)企業(yè)運(yùn)行的要求,最高要滿足社會和可持續(xù)發(fā)展需求,并實(shí)現(xiàn)個(gè)性解放,即有創(chuàng)新能力。
第二個(gè)維度是內(nèi)容維度。按照能力發(fā)展邏輯,從初學(xué)者到專家,完成復(fù)雜程度不同的工作任務(wù),要關(guān)注每一階段的任務(wù)特征、知識形態(tài)和職業(yè)活動特點(diǎn)。
第三個(gè)維度是行動維度。職業(yè)教育要關(guān)注學(xué)生學(xué)會工作,即行動。新職業(yè)教育法第三條明確指出:職業(yè)教育要培養(yǎng)學(xué)生的職業(yè)素質(zhì)和行動能力。
所建立的測評模型和測評題目需要經(jīng)過測量學(xué)驗(yàn)證,即信度、效度、區(qū)分度要達(dá)到一定的要求,這樣的測評才有價(jià)值。測評題目是開放性的,因?yàn)槁殬I(yè)的典型工作任務(wù)沒有標(biāo)準(zhǔn)答案。
職業(yè)能力測評題目特點(diǎn)是,它是來源于職業(yè)及企業(yè)工作實(shí)踐的真實(shí)問題,是職業(yè)的典型工作任務(wù),有不同深度和廣度的答案,為被測學(xué)生留出較大的解決空間。它最大的特點(diǎn)是可以評價(jià)實(shí)踐性知識。測評結(jié)束后,每個(gè)學(xué)生會得到一個(gè)分?jǐn)?shù)和能力特征輪廓圖,由此可以進(jìn)行個(gè)體之間、班級或?qū)W校之間的比較。
要實(shí)現(xiàn)高質(zhì)量的職業(yè)教育學(xué)習(xí)成果評價(jià),第一要理解當(dāng)代社會的職業(yè)技能,即“職教20條”中指出的綜合能力,或稱行動能力。行動能力是個(gè)人在特定職業(yè)、社會和私人情景中進(jìn)行縝密而恰當(dāng)?shù)乃伎?,并對個(gè)人和社會負(fù)責(zé)任行事的意愿和本領(lǐng)。行動能力的評價(jià)只能通過“真實(shí)性評價(jià)”,即在具體工作情景中才能實(shí)現(xiàn),這需要科學(xué)的評價(jià)模型。職業(yè)教育評價(jià)關(guān)心的核心不是傳統(tǒng)的數(shù)理認(rèn)知能力,而是“職業(yè)認(rèn)知能力”或者“工作認(rèn)知能力”,這與普通教育之間有著類型上從差別。
學(xué)習(xí)評價(jià)的目的是為了促進(jìn)學(xué)習(xí)結(jié)果的改善,促進(jìn)學(xué)習(xí)者的能力發(fā)展,即“以評促建”。數(shù)字化評價(jià)的目的與數(shù)字化學(xué)習(xí)方式有直接的聯(lián)系:傳統(tǒng)的學(xué)習(xí)是課程學(xué)習(xí),數(shù)字化學(xué)習(xí)是綜合能力的提高;傳統(tǒng)的課程是有計(jì)劃、學(xué)生被動的學(xué)習(xí),數(shù)字化學(xué)習(xí)是學(xué)生主動的,可根據(jù)需求設(shè)計(jì)自己的學(xué)習(xí)方式;傳統(tǒng)學(xué)習(xí)方式是教師精心設(shè)計(jì)教學(xué)過程和傳授知識,數(shù)字化學(xué)習(xí)是情境學(xué)習(xí)、具有虛擬的、共創(chuàng)和參與式特點(diǎn);傳統(tǒng)學(xué)習(xí)的授課者是老師,數(shù)字化學(xué)習(xí)的老師還包括教練、同伴和實(shí)踐共同體;傳統(tǒng)學(xué)習(xí)評價(jià)主要通過考試鑒定,而有效的評價(jià)還需要實(shí)際應(yīng)用、同行評議和職業(yè)能力測評。
當(dāng)前,我們正在步入Web3.0時(shí)代,但目前數(shù)字化教學(xué)資源建設(shè)的主流思想還停留在Wed1.0時(shí)代,即把書本知識放在網(wǎng)上或云空間?,F(xiàn)在的年輕人是在Web2.0、3.0中成長起來的,他們怎么會對用1.0理念開發(fā)的學(xué)習(xí)資源感興趣?數(shù)字化時(shí)代的職業(yè)學(xué)習(xí)評價(jià),是數(shù)字化的綜合性學(xué)習(xí)與評價(jià),職業(yè)院校與企業(yè)共享學(xué)習(xí)成果共同評價(jià),這需要可促進(jìn)行動學(xué)習(xí)、評價(jià)行動能力的輔助工具,如支持學(xué)習(xí)者做中學(xué)的人機(jī)對話系統(tǒng)和來自真實(shí)工作過程的豐富信息。