這篇回答將會很長,我一點點寫,慢慢更新。

未來五年,在智能時代的技術浪潮衝擊下,我們還需要學語言嗎?

這一小節,主要想談談機器翻譯對語言相關專業可能帶來的機遇與衝擊。

一位做律師的朋友有天這樣跟我說,他經常會在AI協助下起草英文合同,而且,AI提供的很多模板比他自己寫得好多了。他有時候越寫越覺得害怕,科技要全面顛覆法律服務行業了嗎?英美法不斷強調法律文本語言要通俗簡明(plain English),所以當事人和AI聊會兒天,即時拿到一份完整準確的合同,應該是完全可以實現的。

看來不只是翻譯行業,各行各業的從業者都受到人工智慧的衝擊,從而擔憂起自己的飯碗來。隨著機器翻譯的飛速發展,同聲傳譯、交替傳譯、文本翻譯等等是不是都要被突破了,那麼我們學語言還有何用呢?以後都背著一個小AI機器人,是不是各國、各種語言、各種文化的人都可以溝通無障礙呢?

看來,我們真的要從上帝手中奪回巴別塔了。

我做了這樣一個嘗試,將這樣一段略帶有文學性的議論文體的文字放入谷歌翻譯,看看它的效果:

英語會變成一個強勢語言,是因為在英語的世界裡出現了累積了強大的創造力:用英語思考的人寫出了《大憲章》,發明了蒸汽機和電燈,發動了成功的革命,船堅炮利無所不克,萬商出動縱橫海上,訂下了民主規範,領先了科技的發展,又在思想藝術的領域裡出類拔萃,是深邃的思想和創造力造就了語言的強勢,不是語言帶來了深邃的思想和創造力。---龍應台《龍應台的香港筆記》

英文譯文如下:

English becomes a strong language because of the accumulation of powerful creativity in the English world: people who think in English wrote the Magna Carta, invented steam engines and electric lights, and launched a successful revolution, the ship the artillery can be omnipotent, and Wanshang dispatched the sea and the sea, set the democratic norms, led the development of science and technology, and excelled in the field of ideological and art. It is the deep thought and creativity that makes the language strong, not the language. Brought deep thoughts and creativity.

對於這樣一段文字來說,谷歌翻譯的準確性的確不錯,作為英語二語者,我們能發現的錯誤只有很少幾處。但是,我把這段文字發給一位英文母語者,他還是覺得彆扭,於是,他根據自己的母語語感在不改變原義的基礎上進行了一番潤色:

English has become a strong language because of the accumulation of creativity in the English-speaking world: people who think in English wrote the Magna Carta, invented steam engines and electric lights, and launched a successful revolution, their ships and artillery were omnipotent. Thousands of English-speaking businessmen travelled in ships and created an empire. English-speaking people set the democratic norms, led the development of science and technology, and excelled in the field of ideology and art. It is the deep thought and creativity that has made the language strong, not the language itself.

當我們把這段地道的英文再次放入谷歌翻譯的「英譯中」,然後再和龍應台的原文進行對比:

作為為中文母語者,我們顯然能夠感受到兩個版本在語言上的差異。龍的版本我們可以稱之為文學語言,而再一次翻譯過來的中文則只起到達意的目的,語言中的氣勢和渲染力差了很多。

復旦大學的一位從事翻譯研究的學者在智能時代的今天曾說過:翻譯面臨三千年未有之變革。這句話聽來誇張,但在人工智慧飛速發展的今天,又有什麼是不可想像的呢?2016年,谷歌發文表明其機器翻譯實現顛覆性突破,將翻譯誤差降低了 55%-85% 以上[1];

2017年,微軟亞洲研究院與雷德蒙研究院的研究人員宣稱,其研發的機器翻譯系統在新聞報道的中譯英上達到了人類專業譯者水平[2]。看到這些報道,今年高考報志願時,很多想學習英語專業並有志於將來從事翻譯專業的孩子都被我勸退了,人工智慧時代技術為主導的浪潮下,我也不敢說翻譯從業者的將來是否樂觀。但是真正從事翻譯職業的人目前也堅信:如果機器完全理解了人類語言,那不是人工翻譯的末日而是人類的末日。

其實人工智慧在翻譯上和專業的人腦譯者還有很大的差距,這個差距在商務、商業、法律等技術性文本的翻譯上可能相對小一些,但是在人文社科類例如文學著作的翻譯方面差距就非常之大了。不僅如此,在針對日常談話的口譯中,語氣、情感、情緒方面的傳遞也非常微妙,不了解一個人的過去,很難把他的言下之意都翻譯清楚。我曾經和一個朋友開玩笑,如果想要實現智能翻譯無障礙溝通,可能我們先得把這個智能翻譯機器人背上幾年,讓它先儲存足夠多的個人數據,才能在翻譯時準確傳達說話人的情緒、情感、態度和言外之意。

翻譯的差距,就在於譯者的審美、品位和認知不同所帶來的差異。很多詞語在語境中所構成的複雜的意義的解讀是考察譯者功力的難點。舉一個例子:

With time, I found myself increasingly fascinated by the endless ironies and cynicism Shanghai offered to the trained eye of a resident. Art was everywhere, in symbolic visuals sprinkled throughout the street scenes of daily life.

ironies和cynicism大部分學生都翻成了「諷刺」和「憤世嫉俗」,而好的翻譯應該是「反差」和「趣味」,從諷刺和憤世嫉俗到反差和趣味,需要譯者的對整段文字的把握,並能給一個非常恰當貼切的中文對應。大部分學生做不到,而機器更做不到。這一段英文中還有這一段英文中還有一個the trained eye of a resident,我也諮詢了專業譯者,這個怎麼翻呢?「經受了熏陶的居民眼光嗎?」,她告訴我,正式出版時,這裡翻譯成了「老上海人」。多麼簡潔而精妙!

其實,除去文學類翻譯,即便是技術文檔也未達到出版質量,但機器翻譯最為人稱道的可能是效率問題,有了機器翻譯的幫助可以節省譯者90%的時間。毋庸置疑的是,新時代的翻譯從業者將是掌握語言、文化、翻譯技能和技術的人士,靠著紙筆一字一句的翻譯時代已經過去了,譯者需要學會利用技術,如果一直從事某個垂直領域或者某個固定文學類型的翻譯,或許可以建立自己的語料庫,通過訓練自己的翻譯AI創建屬於自己的定製化引擎。如果一位譯者只翻譯村上春樹的著作,那麼他可以先訓練村上春樹已有作品的中日對照翻譯模型,接下來,每當村上完成一部新著作,譯者只需要將此書輸入自己訓練定製化模型中,中文版本就生成了。當然,這依然需要譯者進一步的精心雕琢,這樣做只是節省了時間,而並不能保證質量。正如浙江大學的何文忠教授所言,機器翻譯並不能替代譯者,機器擅長識別人的需求,譯者需要做的是利用機器的這一性能。

主人,您是要把這本書翻譯成中文嗎?

而不是,您是要這本書的中文版本嗎?

回到這個題目:未來5年,語言學領域(翻譯專業)會不會出現新的趨勢和變化,我作為語言學領域的外行,我覺得不會有太大的改變。歡迎機器學習、機器翻譯行業的內行批評指正

未來五年,在認知神經科學的衝擊下,傳統語言學研究會有什麼發展趨勢呢?

Science在2019年出了一期腦與語言的特刊,特刊的題目叫作:MORE THAN A TOOL FOR COMMUNICATION。這一期特刊的五篇review基本都支持「語言不是domain-specific的,而是domain-general的」這個觀點,也就是說,以往我們認為的語言具有一個特有的語言區這種想法值得質疑,語言的理解與產出這個過程聯結的大腦中的各個區域,是一個多網路協同的過程。這個觀點雖然在最近這幾年慢慢浮現出來,但是今年出的這一期特刊對過往的研究和觀點做了一次總結,一鼓作氣讀完還是有一種「指引方向」的感覺,我認為未來語言學研究的趨勢不得不考慮認知神經科學所帶來的洞見,喬姆斯基引領的語言模塊論以及相關的針對語言本身的研究或許會接受到新一波前所未有的具有顛覆性的挑戰:語言的普遍性是因為人類認知的普遍性。

舉其中一篇文章作為例子:Hagoort, P. (2019). The neurobiology of language beyond single-word processing. Science, 366(6461), 55-58.

https://mp.weixin.qq.com/s/klyWUn7IkXU4GokfaZweCQ 這個公眾號有中文版的編譯和解讀,我最早也是在這個公眾號看到的,然後去看了Science的這一期語言與腦的特刊。

Hagoort認為語言能力可以分為兩個部分:

基本語言單元 (Elementary Linguistic Units, ELUs) ,即和語言本身有關的知識,包括語音、語義、語法、字形特徵(象形文字or拼音文字)等等,也就是語言的符號系統。

基本語言功能(洪波翻譯為:核心語言功能)? (Elementary Linguistic Operations, ELOs):即和語言理解和產出相關的加工、提取、組合等心理過程。

對語言能力的這一解讀其實也等於區分了理論語言學的學者和應用語言學(包括心理語言學、社會語言學、認知語言學等)學者們的研究範圍。

經典的認知神經科學認為大腦中有負責語言加工的腦區,或者具有獨立的模塊,各個區域有著嚴格的功能分工,而Haggort認為經典的認知神經科學之所以得出這樣的結論是因為研究者們只關注了語言本身的處理,而語言的運用需要結合基本語言功能例如大腦對信息的預測以及根據語境進行的語用推理等等。

Hagoort的結論為:

語言運用中基本語言組成單元ELUs的處理很大程度上是語言學專有的 (domain-specific),但基本語言功能?ELOs的一些關鍵部分,比如整合統一的能力可能也與其他認知功能(音樂、算術等)相一致。也就是說,語言運用中除了不同語言相關 (language-specific) 腦區負責語言的多種子功能外,其他腦網路(負責其他認知任務)的參與也都為充分理解語言語句所表達的含義,充分發揮語言在溝通交流中的重要作用提供了支持。因為語言的理解和運用遠遠不止單個字詞的加工和處理,也遠遠超出通過初級感覺皮層輸入的聲學或字形特徵所蘊含的信息。當然,這個多網路協同的觀點並非否認,將來研究者還需要對多個腦網路中不同節點在語言加工中的特定貢獻的進行更加深入的研究。

來源於:https://mp.weixin.qq.com/s/klyWUn7IkXU4GokfaZweCQ

那麼,結合這一期特刊,我們也可以看到,語言不是一個單獨存在的系統,語言是使用著的語言,只是針對「語言本身」的傳統語言學研究在未來會受到諸多限制,結合心理學、認知神經科學的跨學科視野下可能才是語言學未來發展的趨勢。


@四顧劍 謝謝

剛好最近看到一篇文章直接貼過來吧:

Pylkk?nen, L. (2019). The neural basis of combinatory syntax and semantics. Science, 366(6461), 62-66.

這篇文章的主要意思是討論了語言如何建立意義並為組合系統的未來神經生物學研究提供了方向。人類的自然語言使我們能夠從有限的基本構建塊中創建無限的想法,該組合系統的神經生物學是什麼?現在的研究已經開始剖析神經基礎通過分析意義構成的基礎知識來分析自然語言的句法和語義,例如兩個單片語合而成的短語。這項工作揭示了一個組成系統,該系統涉及到左前顳葉的快速峰化活動以及隨後的內側前額葉皮層的接合。兩個大腦區域都顯示出在理解與產出口語和手語之間共享處理的證據,兩者似乎都是在計算意義,而不是句法結構。

所以,biolinguistic或者說cognitive neuroscience of language已經是今後語言研究的大趨勢之一的話,還需要加上computational modeling就更好了。

最近看到了Li, Jixing(2019)的博士論文,是通過計算模擬?大腦功能造影來分析英語和漢語代詞解析的差異,結合syntax ,neurolinguistic和computational linguistics。

所以,未來5年,估計將會有一大批neuro+psycho+computational 的文獻出現吧。


這個問題如果限定一個學科範圍,限定國內和國外會相對好回答一些。因為語言學現在幾乎是各自獨立的小圈子,做句法語義和做應用教學說是兩個不同的學科也不為過。

在應用語言學範圍內。傳統意義上應用語言學主體是語言教學、語言測試、二語習得等範疇,未來五年這些領域會愈發關注AI、互聯網對於學習者、教學過程以及效果的影響。去年AAAL的一個重要主題之一就是技術對於應用語言學的影響,今年BAAL主題是應用語言學面臨的挑戰。顯示出無論國際還是國內學術圈對於技術對於語言教學產生了深遠的影響,而技術變化更迭太快,而研究尚未跟上。

AI技術將以什麼方式進入到語言教學領域目前還看不太清晰。儘管「英語流利說」這類app已經在用用戶大數據分析和優化教學過程(針對這個現象還有一類研究是計算機中介交流,暫時不表),目前理論界還沒有一個比較新的思路來描述和評價這個過程。應該用真實語料,還是語言測試結果,或者受試的核磁圖像作為這一問題的理論建構基礎數據?有很多不同的嘗試。

另一個主要的趨勢在於,越來越多的研究者開始重視量化研究。應用語言學乃至教育學從很早以來傳統就是質性的,建構假設、用代表性案例來描寫過程、然後闡釋是大部分研究的思路。未來為了讓研究更加具備可重複性、可比較性,越來越多的研究開始採用量化研究應該會是一個趨勢。(就像二語習得和語言測試那樣)

另外像翻譯學這類語言學大類之下的子學科,早已經不再局限在翻譯技巧、翻譯能力這塊了。譯後編輯、譯者在翻譯過程中的認知、翻譯過程中的大腦活動早已經興起。用corpus做大規模數據對比之下的研究也非常常見。未來這個趨勢會更加明顯,純文本類研究逐步向更宏觀的理論命題發展。

語言學從學科根基上來說,仍然是解決「語言的認知機制」和「語言演化」兩個最根本問題。從這個意義上來說,未來五年可能會有更多成果,基於真實語料,運用量化方法,試圖解決這兩個核心問題之下的子課題。這個量化方法不再局限於簡單的統計學,比如今年Zhang MH 那篇Nature中用貝葉斯方法,計算機模擬語言演化。另一種思路則是採用核磁等儀器,從腦科學和神經科學的角度描述和解釋,比如之前荷蘭那篇做詞的腦分區的文章。

未來五年,研究者有了更好的數據(這個需要很多基礎工作)、更好的計算方法?(新的演算法?)、更高級的儀器(最近學院採購了一批設備組建了腦科學實驗室),應該能有更多的發現和更好的理論假設。當然這一切也需要更多的人力(人工標註、實驗……),更多的錢和更高的智慧。而最後一點其實是很困難的,Chomsky用一疊紙就能通過畫樹形圖建構一個幾乎自洽的X-bar模型,簡單優美。


很多回答都是洋洋洒洒寫了很多話,但是無論寫多少,恐怕都難以把未來的事說清楚,所以不如說得簡單些。

過去,語言學領域的研究,多是在探索三個方面的問題,分別是組合關係、聚合關係、演變關係。

未來,語言學學科的研究,一部分人依舊保持傳統,而更多的人會關注底層和表層以及底層向表層轉化的問題。底層方面將與神經科學結合,探討語言能力的神經機制;表層方面將與人工智慧結合,探討物質化的語言形式的表達機理。而從底層向表層轉化的問題則需要艱苦的理論構建。

另外,中國的語言學學科的發展面臨很多障礙。首當其衝的最大障礙就是我們的語言學目前依然是跟文學捆綁在一起的,是文學這個一級學科的下位學科,很多單位的領導是研究文學的;而實現語言學提升為一級學科這個目標,估計還得等十年。其次,國內的語言學期刊還在固守傳統人文性,大多數編輯不懂統計、不懂實驗,遑論神經科學、人工智慧。所以,國內的語言學研究在未來的五年未必會有大的改變。


我也不知道為何這幾天陸續有人邀請我一個知乎小透明來回答這樣一個宏大的問題。

"語言學領域"真的好寬泛的,我自己也並不完全做語言學,技術方向也沒學好,讀書還少,大概上來瞎說一點跟我方向較為相關的句法語義及工作相關方面的可能吧,算拋磚引玉了,歡迎批評指正、交流,人身攻擊請免開尊口:

首先,理論語言學內部發展的力量將在更大程度上受到技術發展力量的衝擊,技術發展的水平及需求會倒逼語言學理論轉變研究問題的視角,而技術發展同時也會提供新的研究方法。

傳統句法分析往往從單句入手,靜態地描寫成分、結構層次、關係,無論是辭彙層面還是句法結構、關係層面,最後一批矮處的果實也已經被50-70後那幫學者摘完了,什麼描寫語法、功能語法、配價語法、生成語法、依存語法之類的,從理論到資源建設,就沒有他們沒涉及的,建國以來他們都是借鑒融合、緊跟國外的語言學理論發展方向的,站在巨人肩上,用幾十年的時間把國內共時語言學研究拉到和歐美語言學界平均水平。

現在留給青年學者的都是硬骨頭——怎麼說說清楚語義?我們當然也還是會拿西方做鏡子,但是自然語言處理技術(Natural Language Processing,NLP)經過近十來年的飛速發展,對語言學的影響主要在兩方面:

一方面,檢驗了語法理論成果的實用性,導致形式語法逐漸式微,依存語法強勢崛起與前者平起平坐,然而,技術發展真是太快了,雖然這兩種句法仍然是主流,但傳導錯誤也很嚴重,領域遷移魯棒性差,學界目前雖然還較多地使用句法結構數據,但工業界大多是能不用就不用。然而,目前NLP就是紙老虎,經常像人工智障。雖然,演算法大佬們大都致力於靠演算法模型搞出一個好的語言學模型出來使機器搞懂語言;但是,語言學界也一定會參與進來給出自己的回答,比如生成詞庫論、結合韻律句法的語體語法、意合語法、篇章語法都方興未艾,不過值得注意的是,這些語法理論在研究範圍和研究方法上比傳統的語法理論有更清楚的界定,基本上會盡量避免模糊下定義,盡量做到可量化,分類依據、分類結果會傾向於明確,描寫也會更注重量化分析,會把趨向性與選擇性以可量化的形式描寫得更清楚(做不到這點,文章會越來越難發出來,老一輩的靠著自己積攢多年的影響力還能勉強發出點聲音,年輕一輩不要心存僥倖,所以那些即將讀研的童鞋們選導師盡量避免選擇還在為「王冕死了父親」「雞不吃了」「愛V不V」之類問題爭論不休的導師,時代變了,吃飯和前途要緊)。

另一方面,技術的發展可以極大地提升研究效率,即語言學者會有更多可觀察的語料(幾十上百G語料都可以找到),也會有更方便的檢索方式(包括句法結構檢索),也會有更直接的驗證方式(能否指導資源建設、自動評閱、篇章分析等),當然這就意味著作為句法語義研究的學者需要掌握基本支撐研究的編程語言(python會是主流),或者聯合相關技術研究者組團打怪升級(對雙方要求都較高,需要能理解對方學科的基本思想)。

其次,二語教學漢語市場、翻譯市場會受影響,表現在漢語教學市場進一步縮小,低水平翻譯專業的從業人員將受到極大衝擊。我沒有高贊答主那麼樂觀,當然也沒太悲觀,這個等我搞完年終彙報、盤點再來補充吧。


2020/01/01 終於熬過了悲催的一年,新年把去年沒完成的題答完吧。

二語教學、人工翻譯與機器翻譯是一體三面。

一方面,我們要承認各種翻譯軟體過去5年有非常大的發展,也要相信未來5年也一定會進一步發展。目前的技術,從語音識別翻譯到文本識別翻譯,生活日常溝通、旅行購物需求無疑是沒問題了,而在一些很正式的場合,也能勉勉強強(雖然去年某狗現場翻譯經常死機重啟、某飛被曝剽竊同傳)。再過5年我們有理由相信相關語言數據資源會更豐富,特別是漢語方面,機器翻譯作為NLP中最早的也是目前商業落地最好的方向,對應的相關技術未來5年肯定也會有大的發展,這點可以參考CV方向商業落地後的發展情況。

另一方面,二語學習對大部分人來說是需要付出極大努力的事,如果現在技術可以滿足基本需求,可能就沒那麼多學習者了,特別是非英語的語言。如果不是商業和學業交流的剛性需求,對普通大眾而言,入個門就可以依靠現在便捷又能達意的各式翻譯APP混了,靠翻譯吃飯,需要把外語學得很精通,而這需要付出巨大的時間成本和精力,特別是學習跟自己語言相差甚大的語言,漢語對很多外語來說就是這樣一種語言。當旅遊、日常生活、簡單文字翻譯靠夾生漢語加各種實時翻譯軟體就可以解決問題的時候,人都是懶惰的,過了新鮮勁兒,往往就放棄了。我的一個教授,美國人,來中國三年了,上課就全英文,偶爾感覺我們聽不懂一些詞,拿起手機來對著一通說,手機就翻譯成漢語說出來,雖然翻譯的詞不一定那麼準確,但學生靠背景知識基本就知道專業的或更準確的漢語說法了;而在生活中呢,這個傢伙就靠著自己夾生的漢語加各種手機APP翻譯,走遍了中國。如果大家生活在一線城市,可以嘗試做一些調查,看看這幾年漢語培訓學校起起落落落落落……趨勢有多大;國際高中的留學生人數下滑趨勢及國別分布集中趨勢(韓、泰越老緬、前蘇解體諸國、富非州諸國)如何;非top10以內的高校,來華留學生都是什麼構成情況,是不是非洲、泰越緬老韓諸國及前蘇解體諸國人比重越來越大,拿獎學金或者享受折扣學費的學生比重是不是越來越多;看看各大網站、圈內群中有多少狡猾的老鳥自己開發不出漢語學習者的培訓市場,轉而天天各種授課、賣資源賺剛入門的漢語從業者的錢。當然,我沒有具體的數據,這個留給相關從業者去考察吧。


然而,儘管如此,這並不意味著我在唱衰二語教學與人工翻譯。

就翻譯來說,翻譯從業人員將需要以絕對專業職業能力作為職業護城河。

語言不只是傳遞信息的工具(達意),還是傳情交際的工具,達意機器還可差強人意(雖然不一定精準或者具有文學美感),然而傳情這點機器現在是做不到的。什麼意思呢,比如,交際過程中什麼場景下說什麼話合適(比如敬語使用、陳述與反問使用、比喻與隱喻使用)、親昵與疏遠等的邊界在哪裡、會話與篇章如何組織能連貫及銜接等,這些問題我們相信在未來很多年(可能是我有生之年)都解決不了;此外,語言和語言之間的詞並不是一一對應的,如何表達目標語言中不存在的詞或現象、如何表達光怪陸離的網路用語現象、如何快速理解不同語言之間隨意切換(比如中英夾雜、普通話與方言夾雜、今文與古文夾雜)等。這些都是機器現在不能能解決的問題,而這些對人之間的交際(不只是面對面地交談,也包括作者與讀者的神遇)、如何絕對精確地對譯(國際商貿合同、外交合同等)卻極為重要,這些正是高級人工翻譯無法被取代的原因。

與此同時,機器翻譯水平的提高,可以極大地提高專業翻譯人員的效率,甚至可能凈化翻譯市場,提高從業人員的待遇。不知道大家是否有過這樣的體驗,讓你從零開始翻譯一篇文章是很頭疼的,但是谷歌翻譯一下有個底稿,雖然很爛,但是在此基礎上改起來卻遠比自己從零開始翻譯容易多了;機器翻譯水平的進步,人們對翻譯質量要求會更苛刻,特別是像漢語這樣有著豐富文化資源的語言,一方面會淘汰一些半吊子從業人員和工作室,存活下來的最終將是語言輸出能力對機器保持絕對優勢的隊伍,高端翻譯市場只會更穩固,價格也只會更高。

就教學來說,機器輔助教學及學習資源獲取便捷,可極大地提高自學效率,市場對語言從業者的專業要求也更高。

語言教學大致包含「聽說讀寫」四個方面。比如,「聽說」往往是一體的,很多語言教學的老師其實是不會教聽說課的,學生髮音錯了,他就只一味地反覆重複教學生髮音,這點現在的教學輔助軟體也完全可以做到,而且做得比人還好,可以準確地識別你具體那個音位發得不對,並讓你反覆讀,反覆給你一個50分,反正我內心說了一萬遍F-word。而一個專業的語言老師會先判斷你是因為聽不出這個音而無法發音正確,還是因為你聽懂了但發音肌肉缺乏鍛煉而無法發音正確,不同的原因有不同的訓練方法,而且對容錯點可以把握得很準確,此外他有記憶和分析能力,在未來很長一段時間都會有意識地在交流中訓練你對錯誤點進行聽辨、發音;再比如,很多語言都開發了訓練辭彙使用的對話系統,就跟很多水貨教師教學生生字詞時,機械地造句的對話遊戲,而一個專業的教師,會去激活學生的已有背景知識,設置合適的使用場景把這個詞活用到對話中、實列中,並同時能做到以舊帶新引出以學過的相關、相近的內容。這些都是機器無法做到的,而也是專業教師保有市場的法寶。

比如「讀」,不同水平的學生閱讀什麼樣的文本比較合適,這個問題經驗的判斷往往是很主觀的,而統計的方法輔助專業教師判斷是解決問題的最好方法,根據統計分析詞的難度分布、句長、句法難度分布(漢語的比較難)等,自動改換難詞、難句,輔以專業人士校訂及內容選題把關是目前分級閱讀的主要做法,現在一些小作坊式的培訓機構搞的所謂分級閱讀,真的是一言難盡。

比如「寫」,一些語言教學者給學生改寫作,直接就是把他認為錯的、表達不夠好的地方改成正確的就了事,學生問為什麼,往往說不清,這就和現在的自動改錯系統沒什麼差別了,自動改錯系統也可以逐句把你所有的語法錯誤、用詞可能不準確的地方標識出來,還能針對同一個錯誤給你好幾條修改意見,這就是Grammarly和微軟小英吃飯的本事(順便佩服一下批閱這個市場上的大佬們,開源讓大家使用培養用戶搶佔市場,同時也變相在積累語料和迭代系統,數據為王的時代,真是打得一手好算盤,其它的speaky、italki也差不多),那如果寫作輔導就是這麼簡單,真的不需要老師了。一個專業的寫作老師知道篇章有銜接性、連貫性、目的性、可接受性、信息性、情景性、互文7個基本特點,每個特點下有若干策略和手段,這其中的任何一點都是機器做不到的,未來很長一段時間機器都不可能做到。

總結一下:未來5年或者更遠的未來,AI行業的發展一定會對理論語言學、應用語言學帶來極大的影響,這些影響對於相關從業者來說有好有壞,對行業來說則完全是好事,強迫相關人士關注技術、關注現實、學習及掌握技術工具。但以我初淺的認識來看,鼓吹語言學將被自然語言處理取代也是沒有道理的,語言學研究的對象是語言,語言是活的,一旦進入交際,它編碼知識、存儲知識、激活我們人類共享的大量背景知識與場景,並以此為基礎自發而靈活地交流;而AI技術本質是在一個較為確定系統基礎上處理語言、判斷、反饋、輸出的,它有自己的潛力和局限。


推薦閱讀:
相关文章