中文的方言較多,不同的方言之間差距很大,這也是中文語音識別的一個難題如果是基於普通話識別的,中文的同音字詞又比較多,所以簡單的字詞識別比較困難。很多的語音識別都是採用語義分析進行判斷的,比如科大訊飛推出的訊飛語音輸入法,主要就是基於語義分析識別句子的,而對單個字詞的識別則比較差


個人認為還是發音的區別吧,現在不少語音識別的軟體,可以識別普通話,但要識別上海話、湖南話就不容易了,現在的識別出來的錯別字也少了,可以通過前後語句來判斷發音者的意思,小編這裡有一款可以中英文的軟體,來看看。

在應用商店裡邊找到錄音轉文字助手的這個工具,然後在主頁裡邊看到有好幾個功能,選擇裡邊的錄音機功能。

在錄音機裡邊可以開始錄音了以後,錄完了就可以保存錄音文件在文件庫看到。

在文件庫的界面點擊右上方的轉文本,識別成功了以後,就可以看到你的語音文件轉成文字了。


我感覺是中文的多音字比較多,在語音上要結合語境的時候特多,而英文似乎比較少
補充:英文不需要分詞,中文需要分詞。


中文有聲調
語音識別主要有以下五個問題:   1.對自然語言的識別和理解。首先必須將連續的講話分解為詞、音素等單位,其次要建立一個理解語義的規則。   2.語音信息量大。語音模式不僅對不同的說話人不同,對同一說話人也是不同的,例如,一個說話人在隨意說話和認真說話時的語音信息時不同的。一個人的說話方式隨著時間變化。

  3.語音的模糊性。說話者在講話時,不同的詞可能聽起來是相似的。這在英語和漢語中常見。

  4.單個字母或詞、字的語音特性受上下文的影響,以致改變了重音、音調、音量和發音速度等。   5.環境雜訊和幹擾對語音識別有嚴重影響,致使識別率低。
推薦閱讀:
相關文章