個(gè)性化音色調(diào)用
說(shuō)明
Hi,您好,歡迎使用有道智云個(gè)性化語(yǔ)音調(diào)用接口服務(wù)。
本文檔主要針對(duì)需要集成HTTP API的技術(shù)開發(fā)工程師,詳細(xì)描述個(gè)性化語(yǔ)音調(diào)用相關(guān)的技術(shù)內(nèi)容。
如果您有與我們商務(wù)合作的需求,可以通過(guò)以下方式聯(lián)系我們:
商務(wù)郵箱: AIcloud_Business@corp.youdao.com
如果您對(duì)文檔內(nèi)容有任何疑問(wèn),可以通過(guò)以下幾種方式聯(lián)系我們:
客服QQ:1906538062
智云翻譯技術(shù)交流QQ 1群: 652880659
智云翻譯技術(shù)交流QQ 2群: 669384425
智云翻譯技術(shù)交流QQ 3群: 807539209
智云翻譯技術(shù)交流QQ 4群: 936752411
聯(lián)系郵箱: zhiyun@corp.youdao.com
溫馨提示:
- 本文檔主要針對(duì)開發(fā)人員,接入測(cè)試前需要在控制臺(tái)開通賬戶;如果您還沒(méi)有,請(qǐng)按照 新手指南 獲取。
- 接入時(shí)需要購(gòu)買語(yǔ)音定制資源包或者聯(lián)系商務(wù)開通,供測(cè)試使用,可在平臺(tái)免費(fèi)體驗(yàn)。
接口說(shuō)明
個(gè)性化語(yǔ)音調(diào)用服務(wù),用戶可迅速使用自己定制的語(yǔ)音合成服務(wù)。
服務(wù)主要分模型定制和模型調(diào)用兩部分。
協(xié)議須知
調(diào)用方在集成個(gè)性化語(yǔ)音調(diào)用服務(wù)API時(shí),請(qǐng)遵循以下規(guī)則。
規(guī)則 | 描述 |
---|
傳輸方式 | HTTPS |
請(qǐng)求方式 | GET或POST |
字符編碼 | 統(tǒng)一使用UTF-8 編碼 |
請(qǐng)求格式 | 表單 |
響應(yīng)格式 | JSON |
接口調(diào)用參數(shù)
個(gè)性化語(yǔ)音定制調(diào)用地址:
https://openapi.youdao.com
模型調(diào)用階段
調(diào)用TTS接口
- 接口uri:/ttsapi/tts/model
- 接口說(shuō)明:
模型訓(xùn)練成功以后,如果要合成的內(nèi)容為文本,調(diào)用此接口。
參數(shù)名稱 | 類型 | 含義 | 是否必填 | 示例 |
---|
appKey | String | 應(yīng)用ID | True | 可在 應(yīng)用管理 查看 |
salt | String | UUID(唯一識(shí)別通用碼) | True | UUID |
curtime | String | 時(shí)間戳(秒) | True | 秒 |
sign | String | 簽名 | True | sha256(應(yīng)用ID+salt+curtime+應(yīng)用密鑰) |
signType | String | 簽名版本 | False | v4 (目前僅支持v4) |
version | String | 接口版本 | False | v1 (目前僅支持v1) |
docType | String | 服務(wù)器響應(yīng)類型 | False | json (目前僅支持json) |
modelId | String | 模型ID | True | M_CC164FF7040141CD88C96B59B90EC695 |
q | String | 待合成的文本 (必須是UTF-8編碼,長(zhǎng)度不超過(guò)1000字符,需要進(jìn)行urlencode編碼) | True | 比如:"您好" |
format | String | 音頻格式(支持mp3,wav格式,默認(rèn)mp3) | True | mp3或wav |
rate | String | 合成音頻采樣率(支持8000, 16000, 44100。默認(rèn)44100) | True | 16000 |
speed | String | 語(yǔ)速(取值:0.5-2.0,默認(rèn)1.0) | True | 1.0 |
volume | String | 音量 (取值: 0.5-5.0,默認(rèn)1.0) | True | 0.5 |
需要根據(jù)Content-Type的值確定是否合成成功:
如果合成成功,正常返回為二進(jìn)制語(yǔ)音文件,具體的header信息 Content-Type:audio/x-wav
如果合成失敗,會(huì)返回json結(jié)果,具體的header信息 Content-Type:application/json, 可以根據(jù)(模型錯(cuò)誤碼)確定出現(xiàn)的問(wèn)題。
調(diào)用VC接口
- 接口uri:/ttsapi/vc/model
- 接口說(shuō)明:
模型訓(xùn)練成功以后,如果要合成的內(nèi)容為文本,調(diào)用此接口。
參數(shù)名稱 | 類型 | 含義 | 是否必填 | 示例 |
---|
appKey | String | 應(yīng)用ID | True | 可在 應(yīng)用管理 查看 |
salt | String | UUID(唯一識(shí)別通用碼) | True | UUID |
curtime | String | 時(shí)間戳(秒) | True | 秒 |
sign | String | 簽名 | True | sha256(應(yīng)用ID+salt+curtime+應(yīng)用密鑰) |
signType | String | 簽名版本 | False | v4 (目前僅支持v4) |
version | String | 接口版本 | False | v1 (目前僅支持v1) |
docType | String | 服務(wù)器響應(yīng)類型 | False | json (目前僅支持json) |
modelId | String | 模型ID | True | M_CC164FF7040141CD88C96B59B90EC695 |
file | MultipartFile | 待合成的音頻文件 (2秒-120秒) | True | 音頻文件 |
需要根據(jù)Content-Type的值確定是否合成成功:
如果合成成功,正常返回為二進(jìn)制語(yǔ)音文件,具體的header信息 Content-Type:audio/x-wav
如果合成失敗,會(huì)返回json結(jié)果,具體的header信息 Content-Type:application/json, 可以根據(jù)(合成錯(cuò)誤碼)確定出現(xiàn)的問(wèn)題。
語(yǔ)音合成類型
類型 | 類型描述 |
---|
vc | 語(yǔ)音轉(zhuǎn)語(yǔ)音,輸入音頻,輸出定制化音色音頻 |
tts | 文本轉(zhuǎn)語(yǔ)音,輸入文本,輸出定制化音色音頻 |
服務(wù)配置
輸出格式 | 單次最大請(qǐng)求字符數(shù) | 單次最大請(qǐng)求時(shí)長(zhǎng) | 支持語(yǔ)言 |
---|
wav | 1000 | 2s - 2min | 中文 |
模型錯(cuò)誤碼
錯(cuò)誤碼 | 錯(cuò)誤碼含義 |
---|
101 | 缺少必填的參數(shù),首先確保必填參數(shù)齊全,然后,確認(rèn)參數(shù)書寫是否正確。 |
102 | 不支持的語(yǔ)言類型 |
103 | 翻譯文本過(guò)長(zhǎng) |
104 | 不支持的API類型 |
105 | 不支持的簽名類型 |
106 | 不支持的響應(yīng)類型 |
107 | 不支持的傳輸加密類型 |
108 | 應(yīng)用ID無(wú)效,注冊(cè)賬號(hào),登錄后臺(tái)創(chuàng)建應(yīng)用和實(shí)例并完成綁定,可獲得應(yīng)用ID和應(yīng)用密鑰等信息 |
109 | batchLog格式不正確 |
110 | 無(wú)相關(guān)服務(wù)的有效實(shí)例,應(yīng)用沒(méi)有綁定服務(wù)。注:某些服務(wù)的結(jié)果發(fā)音需要tts服務(wù),需要在控制臺(tái)創(chuàng)建語(yǔ)音合成實(shí)例綁定應(yīng)用后方能使用。 |
111 | 開發(fā)者賬號(hào)無(wú)效 |
112 | 請(qǐng)求服務(wù)無(wú)效 |
113 | q不能為空 |
114 | 不支持的圖片傳輸方式 |
115 | 語(yǔ)音包異常:不存在或者已刪除或者不屬于當(dāng)前devId |
116 | modelId 無(wú)效 |
201 | 解密失敗,可能為DES,BASE64,URLDecode的錯(cuò)誤 |
202 | 簽名檢驗(yàn)失敗 |
203 | 訪問(wèn)IP地址不在可訪問(wèn)IP列表 |
205 | 請(qǐng)求的接口與應(yīng)用的平臺(tái)類型不一致,確保接入方式(Android SDK、IOS SDK、API)與創(chuàng)建的應(yīng)用平臺(tái)類型一致。 |
206 | 因?yàn)闀r(shí)間戳無(wú)效導(dǎo)致簽名校驗(yàn)失敗 |
207 | 重放請(qǐng)求 |
303 | 服務(wù)端的其它異常 |
401 | 賬戶已經(jīng)欠費(fèi)停 |
402 | offlinesdk不可用 |
403 | 無(wú)權(quán)限 |
404 | 資源不存在 |
405 | auth服務(wù)不可用 |
117 | 鑒權(quán)失敗 |
110 | 無(wú)相關(guān)服務(wù)的有效實(shí)例 |
303 | 服務(wù)端異常 |
2004 | 合成字符過(guò)大 |
2301 | 合成失敗 |
2302 | 合成次數(shù)不足 |
2303 | 文件不能為空 |
2304 | 文件錯(cuò)誤 |
2305 | 文件格式錯(cuò)誤 |
2306 | modelId 無(wú)效 |
2307 | packetId 無(wú)效 |
2308 | 文件大小錯(cuò)誤 |