近日,滿易PTE王牌教師Jessie @滿易PTE Jessie 和Jennifer老師 @滿易PTE Jennifer 接受培生Pearson官方的邀請,參加官方組織的培訓與教學研討,並喜獲培生官方認證。

下面我們就從官方視角來解密一下神秘的PTE機器評分系統。

來自培生Pearson內部培訓會

以上是培生機器判分的兩大核心技術。這兩個判分引擎,一個是針對語音(Versant),一個是針對文字(intelligent essay assessor)。那麼這兩大技術都是培生官方斥巨資採購研發的,整體上研發一套系統的題的花費甚至在百萬英鎊!是的你沒有看錯,為什麼會這樣呢?

一個是研發語言考試是一個大樣本的實驗,需要採集來自各地區的樣本數據,之後在大數據的基礎上建立模型分析,先進行一輪的人工打分,之後將判分結果的樣本特徵數據進行回歸分析建立模型,得出不同分數段的評分標準,而這個計算量和工作量是相當大的。

培生PTE考試的另一大特點是交叉評分integrated scoring。每科每個題型背後究竟是怎麼影響總分的,是我們一直在關注的。這個步驟是分為兩步,第一步是每個題目的raw score的計算,另一步是將這個分數進行總分的折算,一個是enabling skills 的折算一個是communicative skill的折算。具體的這算公式是一個非常複雜的數據模型,裡面涉及到的參數都是培生官方的機密,但是從和官方的溝通中我們得知,可以肯定的一點是,每個涉及交叉科目的裸分raw score是會同步加到所涉及的科目上的,這個影響是同步多的。比如WFD的某個題目是10分,那麼這個10分是raw score,之後給聽力和寫作加的分數都是十分,並不會因為這個題目本身是聽力部分的題,那麼給聽力加的分數比給寫作加的分數多。那麼從澳洲有PTE培訓以來基本上都是憑藉機構老師或者同學們進考場去試分,來確定具體題型的影響,那麼在這裡可以做統一的解釋了。

所以這也解釋了為什麼經常有同學來問,老師哪些app的評分準確嗎?那麼現在答案其實不言自明了,某些標榜「培生同芯」的測試軟體,請問是什麼「芯」呢?背後的算分邏輯和樣本數據支撐又是什麼呢?能做到交叉算分嗎?

而機器背後的算分邏輯在具體的題型上又是不一樣的,甚至同一題型的不同題目上標準也並不是一塵不變的。是的你沒有聽錯,可是究竟是怎麼回事呢?請持續關注我們公眾號的更新以及公開課的通知。滿易的PTE培訓師們將在本周的教學研討會上從官方視角為大家帶來更深層次的分析,比如:你的發音為什麼分數低?口語題目具體是如何判分的?怎麼樣才能更好的應對機器判分提高自己的成績?

滿易 PTE:官方視角分析PTE口語發音機器判分中的常見誤區?

zhuanlan.zhihu.com
圖標

PTE考試趨勢

和在官方的交流中我們獲悉,今年十月左右PTE有望獲得在全英國範圍內的全部認可,這無疑對廣大計劃申請留學的小夥伴們是一個利好消息。另外,培生計劃年內在重慶增設一個考點,對於廣大中部地區的考生又是一個福利啦!此外,培生官方的出題速度也在平穩地提升,一方面會提供更多的模考mock test資料,另一方面題庫的總量也會不斷穩步增加。另外,培生官方還提到由於目前國內考生的樣本量還很小,如果在未來國內考生的樣本數據激增,那麼在寫作方面有可能查重的力度加大。所以同學們儘早報考的考試紅利肯定會更明顯。而我們與培生官方也會保持密切的聯繫,任何評分標準背後參數的調整我們都會第一時間透露給大家的,不用擔心!

推薦閱讀:

相关文章