在語(yǔ)言能力測(cè)試中,評(píng)分的公平性與科學(xué)性是考生最為關(guān)注的核心問(wèn)題之一。思培考試(CELPIP)作為一項(xiàng)國(guó)際認(rèn)可的英語(yǔ)水平測(cè)試,其評(píng)分機(jī)制備受矚目。從閱讀與聽(tīng)力的客觀評(píng)分到口語(yǔ)與寫(xiě)作的多維度評(píng)估,思培考試如何確保每位考生的成績(jī)真實(shí)反映其語(yǔ)言能力?接下來(lái)將深入解析思培考試的評(píng)分方法、流程、標(biāo)準(zhǔn)及常見(jiàn)問(wèn)題,為你揭開(kāi)這一權(quán)威考試背后的評(píng)分邏輯。
什么是思培
思培考試(又稱加拿大英語(yǔ)語(yǔ)言能力測(cè)試)是加拿大移民,公民和難民部(Immigration, Refugees and Citizenship Canada)認(rèn)可用于移民和公民身份的英語(yǔ)考試。
思培考試由Paragon Testing Enterprises研發(fā)和管理,為加拿大永久居民申請(qǐng)人量身打造??荚噧?nèi)容涵蓋一系列與移民到加拿大相關(guān)的實(shí)際情景,旨在考量加拿大移民申請(qǐng)人在日常生活相關(guān)的場(chǎng)景中與他人交流能力
CELPIP閱讀和聽(tīng)力部分的評(píng)分方法
CELPIP閱讀和聽(tīng)力的所有題目均采用選擇題或其他相似題型設(shè)計(jì)。所有閱讀和聽(tīng)力部分的答案都采用二分法計(jì)分:答案要么正確,要么錯(cuò)誤。未作答的題目被視為錯(cuò)誤答案。所有評(píng)分工作均由計(jì)算機(jī)系統(tǒng)自動(dòng)完成。
CELPIP口語(yǔ)和寫(xiě)作部分的評(píng)分方式
CELPIP-General測(cè)試的口語(yǔ)和寫(xiě)作部分由經(jīng)過(guò)培訓(xùn)的專業(yè)評(píng)分員進(jìn)行評(píng)分,這些評(píng)分員熟知一致的評(píng)分標(biāo)準(zhǔn),基于標(biāo)準(zhǔn)評(píng)分量表對(duì)考生的表現(xiàn)進(jìn)行評(píng)估。評(píng)分員會(huì)接受持續(xù)的培訓(xùn)和定期監(jiān)控。Paragon公司利用評(píng)分員一致性統(tǒng)計(jì)指標(biāo)來(lái)判斷評(píng)分質(zhì)量;針對(duì)某位考生,若一位評(píng)分員給出的評(píng)分與該考生其他評(píng)分員的評(píng)分足夠接近(即達(dá)成共識(shí)),則認(rèn)為這位評(píng)分員與其他評(píng)分員達(dá)成了一致意見(jiàn)。
思培考試CELPIP評(píng)分程序
所有測(cè)試均通過(guò)在線系統(tǒng)隨機(jī)分配給評(píng)分員,始終保持考生匿名性。每位考生在各部分的任務(wù)表現(xiàn)(例如,考生在組件中對(duì)所有任務(wù)的回答)都將由多名評(píng)分員進(jìn)行評(píng)估。每位CELPIP口語(yǔ)測(cè)試者的表演至少由三位口語(yǔ)評(píng)分員評(píng)分,而每位CELPIP寫(xiě)作測(cè)試者的寫(xiě)作至少由四位寫(xiě)作評(píng)分員評(píng)分。評(píng)分員相互獨(dú)立工作,且不知曉其他評(píng)分員所給出的評(píng)分。
評(píng)分標(biāo)準(zhǔn)
針對(duì)寫(xiě)作和口語(yǔ)部分制定的評(píng)分維度已在本頁(yè)面上方的“性能標(biāo)準(zhǔn)”部分列出:
口語(yǔ):內(nèi)容/連貫性、詞匯、可聽(tīng)性和任務(wù)完成度
寫(xiě)作:內(nèi)容/連貫性、詞匯、易讀性和任務(wù)完成度
每個(gè)維度都被細(xì)分為五個(gè)性能等級(jí),并為每個(gè)等級(jí)在每個(gè)維度提供了性能描述符。評(píng)分員通過(guò)對(duì)考生表現(xiàn)中與評(píng)分標(biāo)準(zhǔn)匹配的具體證據(jù)進(jìn)行識(shí)別,為每個(gè)維度分配一個(gè)等級(jí)。
基準(zhǔn)評(píng)分
當(dāng)對(duì)考生表現(xiàn)的評(píng)分完成后,會(huì)檢查評(píng)分的一致性。如果評(píng)分存在分歧,系統(tǒng)會(huì)自動(dòng)指派一名基準(zhǔn)評(píng)分員對(duì)該表現(xiàn)進(jìn)行評(píng)估。所有基準(zhǔn)評(píng)分員均為經(jīng)驗(yàn)豐富的評(píng)分員,他們?cè)谠u(píng)分過(guò)程中表現(xiàn)出一貫的準(zhǔn)確性和可靠性?;鶞?zhǔn)評(píng)分員并不知道最初的評(píng)分結(jié)果。
最終分?jǐn)?shù)如何確定?
口語(yǔ)和寫(xiě)作部分的分?jǐn)?shù)來(lái)源于評(píng)分員所給予的各個(gè)維度的評(píng)分。這些分?jǐn)?shù)隨后會(huì)被轉(zhuǎn)換成CELPIP等級(jí)。轉(zhuǎn)換規(guī)則由參與標(biāo)準(zhǔn)設(shè)定練習(xí)的英語(yǔ)語(yǔ)言專家制定。標(biāo)準(zhǔn)制定是一個(gè)廣泛的、以研究為基礎(chǔ)的過(guò)程。語(yǔ)言專家與測(cè)試專業(yè)人員合作,確定語(yǔ)言學(xué)習(xí)者在每個(gè)性能等級(jí)(例如CLB 8)應(yīng)具備的能力。然后,專家們對(duì)測(cè)試進(jìn)行詳細(xì)分析,確定應(yīng)試者在每個(gè)CELPIP級(jí)別需要達(dá)到的水平。這一過(guò)程在每個(gè)口語(yǔ)和寫(xiě)作部分的分?jǐn)?shù)與其相應(yīng)的CELPIP級(jí)別之間建立了一種可靠的聯(lián)系。
思培考試CELPIP評(píng)分常見(jiàn)問(wèn)題
是否每位考生都是使用的同一套試卷?
出于安全考慮,存在多種不同的考試版本(測(cè)試形式)。即使在同一時(shí)間段參加考試,不同的考生也會(huì)被分配不同的測(cè)試形式。每個(gè)測(cè)試形式中會(huì)包含一些獨(dú)有的題目,也可能包含與其它形式共享的一些題目。Paragon采取多套試卷的形式來(lái)管理考試,目的是最大程度降低考前有人接觸到試題的風(fēng)險(xiǎn),從而避免考生因此取得不公平或不應(yīng)得的高分。
考試中有未得分的題目嗎?
是的,新的題目會(huì)不斷編寫(xiě)出來(lái)。在這些題目作為計(jì)分題目投入使用之前,會(huì)先進(jìn)行預(yù)測(cè)試,以確保它們的質(zhì)量與現(xiàn)有題目相當(dāng)。Paragon會(huì)在每次測(cè)試中包含一些新編寫(xiě)的題目,這些題目看起來(lái)與計(jì)分題目無(wú)異,但它們并不用于計(jì)算你的最終得分。Paragon不會(huì)告訴考生哪些題目是不計(jì)分的,因?yàn)橹匾氖强忌鷳?yīng)對(duì)每一個(gè)題目盡全力作答。這樣做可以確保收集到的新題目數(shù)據(jù)能用來(lái)評(píng)估其質(zhì)量。只有表現(xiàn)良好的題目在未來(lái)才會(huì)被用作計(jì)分題目。
不同試卷難度是否相同?
盡管每份試卷包含不同的問(wèn)題,但每份試卷都是遵循明確的內(nèi)容和難度指導(dǎo)原則構(gòu)建的。Paragon通過(guò)預(yù)測(cè)試和試卷創(chuàng)建流程確保了不同試卷的難度大致相同。然而,每次考試的題目并非完全相同,這意味著試卷間可能存在微小的難度差異。如果最終測(cè)試分?jǐn)?shù)沒(méi)有校正這些小差異,對(duì)考生而言將是不公平的。因此,通過(guò)分?jǐn)?shù)等值化的過(guò)程,甚至消除了這種輕微的變異性,確保了考試公平性。
思培考試CELPIP中什么是分?jǐn)?shù)等化?
等分是根據(jù)不同試卷難度的細(xì)微差別對(duì)最終分?jǐn)?shù)進(jìn)行修正的過(guò)程。例如,如果一名應(yīng)試者在相對(duì)簡(jiǎn)單的試卷上答對(duì)了30道題,而另一名應(yīng)試者在較難的試卷上答對(duì)了30道題,那么等分法就會(huì)糾正試卷難度上的差異。最重要的是,兩種測(cè)試形式所報(bào)告的分?jǐn)?shù)必須具有可比性。我們需要確保最終分?jǐn)?shù)能夠反映您的基本語(yǔ)言水平,而不是取決于您或其他人所回答問(wèn)題的難度。
為什么思培考試CELPIP不出具原始分?jǐn)?shù)?
任何測(cè)試的目標(biāo)都是不論具體考試題目如何,都要為每位考生提供公正且準(zhǔn)確的評(píng)估。雖然CELPIP測(cè)試在編制過(guò)程中遵循了內(nèi)容和難度的相關(guān)指導(dǎo)原則,但仍然可能出現(xiàn)不同試卷之間難度稍有差異的情況。原始分?jǐn)?shù)僅僅是考生答對(duì)題目的數(shù)量之和,它無(wú)法顧及這些細(xì)微的難度差異。因此,在不同形式的測(cè)試中,一個(gè)原始分?jǐn)?shù)30分可能代表的意義并不相同。這就意味著不同考生的原始分?jǐn)?shù)難以解讀和比較。
為了彌補(bǔ)不同試卷之間的差異,Paragon將考生的原始分?jǐn)?shù)轉(zhuǎn)化為標(biāo)準(zhǔn)化分?jǐn)?shù)。標(biāo)準(zhǔn)化分?jǐn)?shù)對(duì)原始分?jǐn)?shù)進(jìn)行了統(tǒng)一調(diào)整,使得在不同形式的測(cè)試中,考生的成績(jī)可以互相比較。
思培考試CELPIP分?jǐn)?shù)等級(jí)是如何確定的?
在確定閱讀和聽(tīng)力的標(biāo)度分?jǐn)?shù)后,將其轉(zhuǎn)換為CELPIP級(jí)別。轉(zhuǎn)換規(guī)則是由參與標(biāo)準(zhǔn)制定工作的英語(yǔ)專家制定的。標(biāo)準(zhǔn)設(shè)定是一個(gè)廣泛的、以研究為基礎(chǔ)的過(guò)程。語(yǔ)言專家與測(cè)試專業(yè)人員合作,確定語(yǔ)言學(xué)習(xí)者在每個(gè)成績(jī)等級(jí)(如CLB 8)上需要具備的能力。然后,專家們對(duì)測(cè)試進(jìn)行詳細(xì)分析,確定應(yīng)試者在每個(gè)CELPIP級(jí)別需要達(dá)到的水平。這一過(guò)程在每個(gè)閱讀和聽(tīng)力標(biāo)度分?jǐn)?shù)與其相應(yīng)的CELPIP級(jí)別之間建立了可靠的聯(lián)系。
思培考試CELPIP閱讀和聽(tīng)力分?jǐn)?shù)的可靠性如何?
衡量測(cè)驗(yàn)可靠性的方法有很多??死拾秃咋料禂?shù)(Cronbach's alpha)就是一種很好的可靠性測(cè)量方法,它專門(mén)測(cè)量測(cè)驗(yàn)表的內(nèi)部一致性。這一統(tǒng)計(jì)測(cè)量的結(jié)果范圍為-1到+1,其中-1表示完全缺乏內(nèi)部一致性,+1表示完全一致。0.80或更高的結(jié)果被認(rèn)為是極好的。對(duì)于CELPIP閱讀和聽(tīng)力部分,測(cè)試表的平均克朗巴赫α系數(shù)(Cronbach's alpha)值為0.88。這表明思培考試CELPIP閱讀和聽(tīng)力測(cè)試表具有極好的內(nèi)部一致性。
通過(guò)以上介紹,相信你已全面了解思培考試評(píng)分機(jī)制的科學(xué)性與公平性。無(wú)論是閱讀、聽(tīng)力的客觀評(píng)分,還是口語(yǔ)、寫(xiě)作的多維度評(píng)估,思培考試都以嚴(yán)謹(jǐn)?shù)牧鞒毯透邩?biāo)準(zhǔn)確保每位考生的成績(jī)真實(shí)可靠。如果您正準(zhǔn)備參加思培考試,或?qū)υu(píng)分機(jī)制仍有疑問(wèn),不妨進(jìn)一步探索相關(guān)資源,為您的語(yǔ)言能力提升做好充分準(zhǔn)備。思培考試不僅是語(yǔ)言能力的測(cè)試,更是邁向國(guó)際化發(fā)展的重要橋梁。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.