原創(chuàng):王開東
教育和醫(yī)學(xué),非常相似。一個解決人精神的成長,一個醫(yī)治人肉體的傷痛。奇怪的是,醫(yī)學(xué)性命攸關(guān),但社會對醫(yī)學(xué)幾乎沒有什么評價,這個病該怎么搞,那個病該怎么治,都是醫(yī)生說了算。但對教育,每年高考結(jié)束,人人爭先恐后發(fā)表評論。這是為什么呢?
(資料圖片僅供參考)
答案很簡單,醫(yī)學(xué)具有專業(yè)性,醫(yī)學(xué)是科學(xué)。人們對科學(xué)充滿敬畏之心,無法評價,也評價不了。但教育就不同了。每個人都是教育家,每個人都覺得自己真理在握,誰都能對教育說出子丑寅卯來。
與醫(yī)學(xué)相比,教育這些年幾乎沒什么進步。孔子當(dāng)年罵弟子宰予,爛泥糊不上墻。我們到今天還這樣罵。
答案很簡單,因為醫(yī)學(xué)講究循證,臨床治療以及藥品使用都要基于證據(jù),背后都有大數(shù)據(jù)的支撐。新藥研發(fā)過程中的雙盲比對,使用成效的逆向追溯等等,醫(yī)學(xué)最終拿出的結(jié)果都是有學(xué)理支撐的,都是有實證的,比如現(xiàn)在很有名的醫(yī)學(xué)循證。
但教育呢?教育沒有循證。教育講究理念和藝術(shù),注重經(jīng)驗感受,缺少科學(xué)實證,越來越玄乎,差不多成為一門玄學(xué)了。都是我感覺如何,覺得怎樣,認(rèn)為該怎樣。一千個人眼里有一千種好的教育。
醫(yī)學(xué)現(xiàn)在很成熟了,一個病一旦確診,馬上就有一整套成熟的治療方案,還有療效顯著的藥物。但教育呢?比如這個孩子早戀,這個孩子有點小偷小摸,我們有明確的處理方案嗎?有藥到病除的方法嗎?教育沒有。教育都是靠經(jīng)驗。所謂特級教師,就是特別有經(jīng)驗的老師。這些經(jīng)驗在他那里有效,在別人那里未必就是有效的。
正因為這個原因,教育的焦慮遠(yuǎn)遠(yuǎn)大于醫(yī)學(xué)。
區(qū)域的焦慮在于,為什么我們那么努力,區(qū)域教育成績卻越來越下滑?背后真實的原因究竟是什么?
學(xué)校的焦慮在于,我們已經(jīng)把所有時間都精細(xì)化了,但學(xué)生成績還是不見提高。未來我們應(yīng)該向哪里要質(zhì)量?
老師的焦慮在于,為什么我起早貪黑,學(xué)生的成績卻越來越差,一屆不如一屆?
家長的焦慮是,我們把所有時間都堆在孩子身上了,疲憊不堪,不堪重負(fù),為什么孩子成績還是不如別人。別人家的孩子輕輕松松考得很好,這究竟是怎么回事?
請注意,他們所提到的全都是成績。成績來源于哪里?成績來源于考試??荚嚫嬖V我們什么?考試告訴我們一個確定的結(jié)果,告訴你孩子目前的水平和狀況,但考試不能告訴你這種狀況是怎么形成的。你孩子的成績好,為什么好?怎樣變得更好?你孩子成績差,為什么差?如何對癥下藥,獲得最大程度的提高?
這些考試都沒辦法解決,學(xué)科司令有限的數(shù)據(jù)也沒辦法解決。老師認(rèn)為學(xué)生成績下降,就是時間沒到位,不夠努力。如果足夠努力,煙鍋都給你熏黑了,怎么可能成績弄不好?這樣的認(rèn)識都是荒謬的,我們所有的社會焦慮就在這里。
用大數(shù)據(jù)精準(zhǔn)分析孩子教育質(zhì)量的情況,這是我們教育監(jiān)測中心的工作。我們是教育系統(tǒng)的實證主義者,我們根據(jù)大數(shù)據(jù)的追蹤,基于證據(jù),科學(xué)精準(zhǔn)地測量出影響教育質(zhì)量的相關(guān)因素,以及這些影響因素究竟有多大。
所以監(jiān)測與考試不同。
首先是目的不同。統(tǒng)考主要目的是選拔和甄別,對象是指向個體,結(jié)果用作升學(xué)參考;監(jiān)測主要目的是診斷和預(yù)警,對象是指向整體,結(jié)果用于教育決策和教育教學(xué)的改進,無證據(jù),不決策。
其次是內(nèi)容不同,統(tǒng)考重點考察學(xué)生知識、能力、素養(yǎng)水平,監(jiān)測除此外,還設(shè)置師生相關(guān)因素問卷測試,關(guān)注影響學(xué)業(yè)質(zhì)量的各種因素。也就是說,統(tǒng)考只考察學(xué)生的智力因素,我們還可以監(jiān)測出學(xué)生的非智力因素等影響因子。
正因為有這些不同,所以統(tǒng)考用試卷,監(jiān)測用工具。
那么,問題又來了。監(jiān)測為什么不是試卷而是工具?
試卷的分?jǐn)?shù)具有偶然性,語文上周考120,這周90很正常。之所以偶然性很大,是因為試卷的容量有限,考這道題和考那道題,結(jié)果截然不同,考試狀態(tài)也是一個方面。但考試只能如此,因為統(tǒng)考指向所有學(xué)生個體,他們必須全學(xué)科參加,時間有限,題量有限,還必須要甄別出高下。
監(jiān)測為什么叫工具呢?因為工具測量,就像一把尺子一樣,任何時候測量都是一樣,具有極大的穩(wěn)定性。監(jiān)測工具必須具有穩(wěn)定性,才能建立結(jié)構(gòu)化的、多維的、可連續(xù)追蹤的海量數(shù)據(jù)。那么,如何保證監(jiān)測工具的穩(wěn)定性呢?
因為監(jiān)測不指向?qū)W生個體,我們可以等比例抽測AB卷,再抽測少量的錨題C卷,錨題C卷由AB卷合并而成,通過錨題C卷把AB卷難度關(guān)聯(lián)起來。
這樣下來,我們基本做到要點全覆蓋,然后以等概率隨機抽樣的方式,讓區(qū)域?qū)W生參加某一門學(xué)科的某一份試卷測試,這樣全覆蓋的試卷就成了工具。我們還可以對分?jǐn)?shù)進行處理,比如把每年大市的分?jǐn)?shù)錨定為500分,其他的分?jǐn)?shù)相應(yīng)進行處理,這樣的量尺分解決了多次考試、不同學(xué)科以及難度不一的問題,使得所有的分?jǐn)?shù)都能在同一個量尺上衡量。我們還有糾錯機制,可以通過多輪試測剔除一些不好的題目,甚至在考后把區(qū)分度不好的一些題目刪除掉。因為最終得出的是量尺分,所以并不影響我們的分?jǐn)?shù),也不影響工具的精準(zhǔn)度。
但考試就不行。浙江2018年高考,英語試卷的難度設(shè)置出現(xiàn)問題。為了補救,考試院對分?jǐn)?shù)進行了加權(quán)處理。事件暴露后,省教育廳廳長和考試院院長等一大堆人被處理。
監(jiān)測因為低利害,而且不指向個體,所以我們可以穩(wěn)定的通過大數(shù)據(jù)精準(zhǔn)測量出學(xué)生整體的學(xué)業(yè)質(zhì)量,再結(jié)合師生相關(guān)因素的考察,就能找到影響這個學(xué)業(yè)質(zhì)量的真正原因。
我們?yōu)槭薪逃帧^(qū)域和學(xué)校提供精準(zhǔn)科學(xué)的大數(shù)據(jù)分析報告。用大數(shù)據(jù)支撐的實證數(shù)據(jù)告訴你,影響孩子學(xué)業(yè)質(zhì)量的相關(guān)因子究竟有多大,大到我們能不能夠承受。
我曾經(jīng)對監(jiān)測不以為然。蘇州社會版報告說“吃早餐的學(xué)生學(xué)業(yè)成績更好”,我認(rèn)為這個結(jié)論,我不需要看報告也知道。
為什么呢?因為不吃早餐,肚子餓了,聽課效果肯定不佳;長期不吃早餐,對身體健康不利,當(dāng)然不利于學(xué)習(xí);父母不給孩子做早餐,這個家庭氛圍大概率也不利于學(xué)習(xí)。所以這個結(jié)論,不吃早餐的孩子學(xué)業(yè)質(zhì)量不如吃早餐的,對我沒有附加值,沒有意義。
但這是什么?這就是經(jīng)驗式教師的自以為是,這就是玄學(xué)的理解,吃早餐好,但究竟好到什么程度,我知道嗎?我不知道。我也不在乎。中國人都是差不多先生,不在于精準(zhǔn)。
我想起了北大附中的選課幣制度。如果兩個人同時要選油畫,但輔導(dǎo)員只想選興趣更濃厚的學(xué)生。但傳統(tǒng)的方法,我們無法衡量誰更熱愛油畫。
所以北大附中學(xué)生在選課之初都有100個相同的選課幣,這100個選課幣學(xué)生需要分配到不同的課程上,但你只有這100個選課幣,你必須獨立自主地權(quán)衡和取舍,花費選課幣把你的興趣量化出來。老師一看就明白,這個花費60個選課幣的孩子,肯定比花費32個選課幣的孩子更熱愛油畫。因為選課面前沒有貧富,大家都有且只有100選課幣。
我這樣說,大家都已經(jīng)弄明白了。很多人可能只知道結(jié)論,但我們用大數(shù)據(jù)把這個結(jié)論量化了。我們清晰地告訴你們,如何高質(zhì)量地提高孩子們的教育質(zhì)量?如何讓老師們的努力更有方向、更精準(zhǔn),如何讓孩子們的努力摸得著、看得見。
我們告訴家長的,不僅是“吃早餐的學(xué)生學(xué)業(yè)成績更好”,我們還通過大數(shù)據(jù)發(fā)現(xiàn),每天都吃早餐的學(xué)生學(xué)業(yè)成績?yōu)?08分,而從不或極少吃早餐的學(xué)生學(xué)業(yè)成績僅為441分,兩者相差67分。進一步我們又有發(fā)現(xiàn),“家人每天在家做給我吃”的學(xué)生學(xué)業(yè)成績最好,高達(dá)513分。與不吃早餐學(xué)生的學(xué)業(yè)成績差距達(dá)到了72分。
在家中能在安靜的獨立空間中學(xué)習(xí)的學(xué)生學(xué)業(yè)成績?yōu)?08分,而與有干擾的開放空間中學(xué)習(xí)的學(xué)生學(xué)業(yè)成績?yōu)?79分,兩者相差31分。
家庭藏書量超過200本的學(xué)生學(xué)業(yè)成績?yōu)?50分,比家庭藏書量僅為0~25本的學(xué)生學(xué)業(yè)成績高109分。
比如地球人都知道過度使用智能手機對成績有影響,但影響到底有多大?
我們監(jiān)測大數(shù)據(jù)的結(jié)果顯示,周一到周五,每天使用智能手機在0.5小時以下的學(xué)生,得分519分,使用手機超過3小時的學(xué)生,得分只有411分,其學(xué)業(yè)成績相差高達(dá)108分。
再比如父母陪伴孩子,還是隔代陪伴孩子,大家都覺得隔代教育問題多,但多到什么程度?
小學(xué)生母親和父親陪伴的學(xué)生,學(xué)業(yè)成績分別是507分和493分。祖輩陪伴的學(xué)生,學(xué)業(yè)成績是480分。分別高出27分,和13分。即便是爸爸和媽媽陪伴相比,爸爸也比媽媽陪伴少了14分。所以現(xiàn)在我們知道了,好媽媽勝過好老師,媽媽是孩子的第一任老師。
甚至老師的性別也對學(xué)生的閱讀水平產(chǎn)生影響。小學(xué)階段,語文老師性別不同,也對學(xué)生的閱讀能力產(chǎn)生顯著差異,并且在1%的置信水平上顯著。語文老師是女性的,小學(xué)生的閱讀總分均值比語文老師是男老師的小學(xué)生高了16.1分。
是不是做作業(yè)的時間越多越好,以小學(xué)六年級學(xué)生為例,周一至周五平均每天校內(nèi)作業(yè)時間1~1.49小時,學(xué)生的學(xué)業(yè)成績是506分;學(xué)生作業(yè)時間達(dá)到3小時,學(xué)生的學(xué)業(yè)成績是470分。反而低了36分??梢娧菇逃袝r候只有血汗,沒有教育。
還有,補課究竟有沒有效果?如果有效果,效果究竟有多大?睡眠時間多少對成績肯定有影響,但到底影響有多大,能不能承受?這個科學(xué)實證的問題不研究,如果不認(rèn)真分析,我們都將在黑暗中爬行。我們的教育將永遠(yuǎn)是摸著石頭過河。
所以我今天說,我們可以過河,而且不必摸著石頭了,所依靠的就是教育監(jiān)測的力量。教育監(jiān)測,一定會成為降維打擊的有力武器,成為中國教育的新生力量。