基於國內語音合成不溫不火,科大訊飛好像也沒投入多少精力做此方面的優化和技術迭代,而似乎智能家居、智能音箱之類也明顯離不開TTS技術。


先放一下原文章鏈接:Mewlvd的文章 - 知乎 https://zhuanlan.zhihu.com/p/202692908

小老闆一直執著於讓我整理數據,掙扎了很久,終於還是做了

經過半個多月的努力整理出來,才發現這樣一個東西還是蠻有用的,查資料的過程中多麼希望有個人已經幫我整理好了,我直接拿來用(對,就是想做伸手黨),希望能對大家有幫

先來個目錄:

  • TTS和VC數據集
  • TTS和VC生成工具(API介面和網頁介面)
  • TTS和VC相關研究單位

第一部分:相關數據集

數據集名稱/網址/簡單說明

數據堂:https://www.datatang.com/dataset/info/speech/935 19.46小時美國英語女聲合成庫

海天瑞聲:http://www.speechocean.com/business/synthesis.html?bd_vid=11362156655531968452 多語種,可定製

愛數智慧: https://www.magicdatatech.cn/opens/3266.html 愛數智慧中文童聲語音合成數據集

ASV spoof: https://www.asvspoof.org/database 15年,19年 LA

Synthetic Speech Commands Dataset: https://www.kaggle.com/jbuchner/synthetic-speech-commands-dataset 命令詞

CMU ARCTIC Databases:http://festvox.org/cmu_arctic/

Nancy Corpus: http://www.cstr.ed.ac.uk/projects/blizzard/2011/lessac_blizzard2011/ Blizzard Challenge的數據

TTS-Portuguese Corpus:https://www.dropbox.com/s/ohpc7epowv9ct7o/TTS-Portuguese-Corpus.zip?dl=0 (我上不去這個網址,可能需要翻牆 )

German Text-to-Speech: http://ttssamples.syntheticspeech.de/

Audio recordings for Blizzard 2020: http://www.cstr.ed.ac.uk/projects/blizzard/2020/ Blizzard Challenge2020的數據

SAS corpus: https://wiki.inf.ed.ac.uk/CSTR/SASCorpus

BTAS: https://www.idiap.ch/dataset/avspoof

第二部分:轉換工具

2-1 API

捷通華聲: https://www.aicloud.com/dev/ability/index.html?key=tts#ability-experience

Nuance: https://www.nuance.com/omni-channel-customer-engagement/voice-and-ivr/text-to-speech.html

標貝科技: https://www.data-baker.com/tts.html

亞馬遜: https://aws.amazon.com/cn/polly/

思必馳: http://aispeech.com/index.php?m=contentc=indexa=listscatid=56

搜狗: https://ai.sogou.com/product/audio_composition/

科大訊飛:https://www.xfyun.cn/services/online_tts

百度: https://ai.baidu.com/tech/speech/tts

騰訊: https://ai.qq.com/product/aaitts.shtml

微軟: https://azure.microsoft.com/zh-cn/services/cognitive-services/text-to-speech/

京東: https://neuhub.jd.com/ai/api/speech/tts

金山:https://www.ksyun.com/nv/product/TTS.html

滴滴: https://www.didiyun.com/production/sps.html

谷歌: https://cloud.google.com/text-to-speech?hl=zh-cn

IBM: https://cloud.ibm.com/apidocs/text-to-speech

阿里云: https://ai.aliyun.com/nls/tts

出門問問: https://www.chumenwenwen.com/technology/index.html#speech-synthesis

雲知聲: https://dev.hivoice.cn/exp_center/tts/tts.jsp

有道: https://ai.youdao.com/

華為: https://www.huaweicloud.com/product/tts.html

學而思: https://ai.xueersi.com/tts/

極限元: http://www.jixianyuan.com/speechSynthesis.html

DUI: https://www.duiopen.com/openSource/technology/tts

圖靈機器人: http://docs.turingos.cn/sdk/sdkv1/#tts

2-2 在線轉換

知音配音: https://peiyin.wozhiyi.com/newproduction.html?tg=5482

閃電文字語音轉換軟體: https://www.callmysoft.com/yuyinzhuanhuan

在線免費文字轉換語音系統: http://tools.bugscaner.com/tts/

在線AI轉換網: https://www.zaixianai.cn/voiceCompose

VoiceMaker: https://voicemaker.in/

VoiceChanger: https://voicechanger.io/

音品彙: http://www.yinpinghui.com/a/

TOOLFK: https://www.toolfk.com/tool-online-text2video.html

牛片只能配音: https://www.6pian.cn/peiyin.html

培音: http://www.peiyinapp.com/sample.html

未知: https://ttstool.com/

未知: https://freetts.com/ (這個網站里整理了國外很多語音轉換網站)

第三部分:研究單位

(這部分還在整理中,網址也不是技術相關,所以原文章我直接放了圖,圖片服務在升級,後期加上)

我會抽時間繼續更新

希望各位同行指正批評!!!


國內做語音的公司很多,提供了語音開放平台的有:訊飛語音,百度智能語音開放平台,阿里雲,騰訊雲,雲知聲,思必馳,捷通華聲等。國外提供語音合成服務的平台有:微軟、IBM、亞馬遜、谷歌,Nuance等。


科大訊飛,思必馳,捷通華聲等都在做,這項技術已經很成熟了,也有人工智慧的創業公司在做,像極限元,他們也有開放雲平台,可以登陸官網進行了解及試用。

這個問題,我在為自己短視頻找機器人配音的時候專門查過,目前微軟的tts是我用過最逼真的,可以到「微軟聽聽文檔」小程序聽下效果。

國內的話,我推薦一個,深聲科技。目前國內最逼真,逼真度上,基本可以完爆訊飛。


深聲科技感興趣的可以了解一下,會有驚喜,我朋友在深聲科技工作,有的時候會給我分享一些他們做的東西,完全聽不出來是合成的,僅代表個人感受


百度、科大訊飛、捷通華聲、阿里、騰訊、小米、標貝科技(優秀)、思必馳、雲知聲、聲智科技


https://blog.csdn.net/weixin_41021342/article/details/94432723


推薦閱讀:
相关文章