學習母語似乎毫不費力。昨天,襁褓中嬰兒還在咿呀學語;今天,就可以把小孩子拉過來向客人表演背誦古詩。

  但加州大學伯克利分校的一項新研究表明,母語天賦並不是以硬連線的方式寫入了兒童的腦子裏——從出生到年滿18歲,學習語言需要向大腦輸入大量的信息素材。

  研究人員計算出,從嬰兒期到青年期,學習者可吸收約1250萬條關於語言的信息——大約每分鐘2bit——以充分掌握語言模式。研究發現,如果轉換成二進制代碼,輸入的信息可以裝滿1.5MB的軟盤。

  發表在《皇家學會開放科學》期刊上的研究結果挑戰了語言學中的經典假說:語言習得對人類來說不費吹灰之力,機器人可以很容易地掌握它。

  加州大學伯克利分校的心理學助理教授Steven Piantadosi說:“我們的工作是第一項衡量了語言習得所需信息量的研究。它強調兒童和青少年是非凡的學習者,每天能吸收超過1000比特的信息。”

  例如,當出現“火雞”這個詞時,小孩子通常會問:“火雞是一隻鳥嗎?是還是不是?火雞飛嗎?等等,直到掌握火雞這個詞的全部含義。”是,或不是,就相當於邏輯運算中的1和0。

  “爲了理解一個詞語,考慮到小孩子必須記住數百個0和1構成序列時,那就是說他們必須有令人印象非常深刻的學習機制。”Piantadosi說。

  Piantadosi和研究主要作者Frank Mollica博士試圖衡量英語使用者學習母語所需的信息量和信息類型。

  他們在計算機上運行有關語言語義和語法的各種模型。值得注意的是,該研究發現語言知識主要側重於語義,而不是語法。

  “許多關於語言學習的研究都集中在語法上,比如詞序,”Piantadosi說,“但我們的研究表明,語法只是語言學習中的一小部分,而主要的難點在於記住衆多單詞的含義。”

  關注語義與語法的區別也反映人與機器的區別,後者包括Alexa,Siri和Google Assistant等語音控制數字助手。

  “這真的凸顯了機器學習者和人類學習者之間的差異。”Piantadosi說,“機器知道哪些詞彙在一起以及它們在句子中的位置,但對詞語的含義知之甚少。”

  至於雙語人士是否必須存儲兩倍的信息,Piantadosi表示,就語義信息量而言,這是不太可能的,因爲許多語義是跨語言共享的。

  “像'母親'這樣的常用名詞在各種語言中都有相似的語義,所以你不需要通過重新輸入來學習它。”

  本文譯自 berkeley,由譯者 majer 基於創作共用協議(BY-NC)發佈。

相關文章