國內哪些公司有語音合成團隊,在做語音合成(TTS)方面的研發?
基於國內語音合成不溫不火,科大訊飛好像也沒投入多少精力做此方面的優化和技術迭代,而似乎智能家居、智能音箱之類也明顯離不開TTS技術。
先放一下原文章鏈接:Mewlvd的文章 - 知乎 https://zhuanlan.zhihu.com/p/202692908
小老闆一直執著於讓我整理數據,掙扎了很久,終於還是做了
經過半個多月的努力整理出來,才發現這樣一個東西還是蠻有用的,查資料的過程中多麼希望有個人已經幫我整理好了,我直接拿來用(對,就是想做伸手黨),希望能對大家有幫
先來個目錄:
- TTS和VC數據集
- TTS和VC生成工具(API介面和網頁介面)
- TTS和VC相關研究單位
第一部分:相關數據集
數據集名稱/網址/簡單說明
數據堂:https://www.datatang.com/dataset/info/speech/935 19.46小時美國英語女聲合成庫
海天瑞聲:http://www.speechocean.com/business/synthesis.html?bd_vid=11362156655531968452 多語種,可定製
愛數智慧: https://www.magicdatatech.cn/opens/3266.html 愛數智慧中文童聲語音合成數據集
ASV spoof: https://www.asvspoof.org/database 15年,19年 LA
Synthetic Speech Commands Dataset: https://www.kaggle.com/jbuchner/synthetic-speech-commands-dataset 命令詞
CMU ARCTIC Databases:http://festvox.org/cmu_arctic/
Nancy Corpus: http://www.cstr.ed.ac.uk/projects/blizzard/2011/lessac_blizzard2011/ Blizzard Challenge的數據
TTS-Portuguese Corpus:https://www.dropbox.com/s/ohpc7epowv9ct7o/TTS-Portuguese-Corpus.zip?dl=0 (我上不去這個網址,可能需要翻牆 )
German Text-to-Speech: http://ttssamples.syntheticspeech.de/
Audio recordings for Blizzard 2020: http://www.cstr.ed.ac.uk/projects/blizzard/2020/ Blizzard Challenge2020的數據
SAS corpus: https://wiki.inf.ed.ac.uk/CSTR/SASCorpus
BTAS: https://www.idiap.ch/dataset/avspoof
第二部分:轉換工具
2-1 API
捷通華聲: https://www.aicloud.com/dev/ability/index.html?key=tts#ability-experience
Nuance: https://www.nuance.com/omni-channel-customer-engagement/voice-and-ivr/text-to-speech.html
標貝科技: https://www.data-baker.com/tts.html
亞馬遜: https://aws.amazon.com/cn/polly/
思必馳: http://aispeech.com/index.php?m=contentc=indexa=listscatid=56
搜狗: https://ai.sogou.com/product/audio_composition/
科大訊飛:https://www.xfyun.cn/services/online_tts
百度: https://ai.baidu.com/tech/speech/tts
騰訊: https://ai.qq.com/product/aaitts.shtml
微軟: https://azure.microsoft.com/zh-cn/services/cognitive-services/text-to-speech/
京東: https://neuhub.jd.com/ai/api/speech/tts
金山:https://www.ksyun.com/nv/product/TTS.html
滴滴: https://www.didiyun.com/production/sps.html
谷歌: https://cloud.google.com/text-to-speech?hl=zh-cn
IBM: https://cloud.ibm.com/apidocs/text-to-speech
阿里云: https://ai.aliyun.com/nls/tts
出門問問: https://www.chumenwenwen.com/technology/index.html#speech-synthesis
雲知聲: https://dev.hivoice.cn/exp_center/tts/tts.jsp
有道: https://ai.youdao.com/
華為: https://www.huaweicloud.com/product/tts.html
學而思: https://ai.xueersi.com/tts/
極限元: http://www.jixianyuan.com/speechSynthesis.html
DUI: https://www.duiopen.com/openSource/technology/tts
圖靈機器人: http://docs.turingos.cn/sdk/sdkv1/#tts
2-2 在線轉換
知音配音: https://peiyin.wozhiyi.com/newproduction.html?tg=5482
閃電文字語音轉換軟體: https://www.callmysoft.com/yuyinzhuanhuan
在線免費文字轉換語音系統: http://tools.bugscaner.com/tts/
在線AI轉換網: https://www.zaixianai.cn/voiceCompose
VoiceMaker: https://voicemaker.in/
VoiceChanger: https://voicechanger.io/
音品彙: http://www.yinpinghui.com/a/
TOOLFK: https://www.toolfk.com/tool-online-text2video.html
牛片只能配音: https://www.6pian.cn/peiyin.html
培音: http://www.peiyinapp.com/sample.html
未知: https://ttstool.com/
未知: https://freetts.com/ (這個網站里整理了國外很多語音轉換網站)
第三部分:研究單位
(這部分還在整理中,網址也不是技術相關,所以原文章我直接放了圖,圖片服務在升級,後期加上)
我會抽時間繼續更新
希望各位同行指正批評!!!
國內做語音的公司很多,提供了語音開放平台的有:訊飛語音,百度智能語音開放平台,阿里雲,騰訊雲,雲知聲,思必馳,捷通華聲等。國外提供語音合成服務的平台有:微軟、IBM、亞馬遜、谷歌,Nuance等。
科大訊飛,思必馳,捷通華聲等都在做,這項技術已經很成熟了,也有人工智慧的創業公司在做,像極限元,他們也有開放雲平台,可以登陸官網進行了解及試用。
這個問題,我在為自己短視頻找機器人配音的時候專門查過,目前微軟的tts是我用過最逼真的,可以到「微軟聽聽文檔」小程序聽下效果。
國內的話,我推薦一個,深聲科技。目前國內最逼真,逼真度上,基本可以完爆訊飛。
深聲科技感興趣的可以了解一下,會有驚喜,我朋友在深聲科技工作,有的時候會給我分享一些他們做的東西,完全聽不出來是合成的,僅代表個人感受
百度、科大訊飛、捷通華聲、阿里、騰訊、小米、標貝科技(優秀)、思必馳、雲知聲、聲智科技
https://blog.csdn.net/weixin_41021342/article/details/94432723
推薦閱讀: