有几种可能的解决方法可以提供从文本创建音频的能力;其中两个需要请求外部资源,另一个使用meSpeak.js http://www.masswerk.at/mespeak/通过@masswerk。
使用描述于的方法从 Google 下载单词的音频发音 https://www.labnol.org/internet/download-audio-pronunciation-words/21064/,它的缺点是无法预先确定哪些单词实际上作为资源中的文件存在,而无需编写 shell 脚本 https://github.com/thevoiceless/google_words/blob/master/google_words.py或执行HEAD
请求检查是否发生网络错误。例如,“do”一词在下面使用的资源中不可用。
window.addEventListener("load", () => {
const textarea = document.querySelector("textarea");
const audio = document.createElement("audio");
const mimecodec = "audio/webm; codecs=opus";
audio.controls = "controls";
document.body.appendChild(audio);
audio.addEventListener("canplay", e => {
audio.play();
});
let words = textarea.value.trim().match(/\w+/g);
const url = "https://ssl.gstatic.com/dictionary/static/sounds/de/0/";
const mediatype = ".mp3";
Promise.all(
words.map(word =>
fetch(`https://query.yahooapis.com/v1/public/yql?q=select * from data.uri where url="${url}${word}${mediatype}"&format=json&callback=`)
.then(response => response.json())
.then(({query: {results: {url}}}) =>
fetch(url).then(response => response.blob())
.then(blob => blob)
)
)
)
.then(blobs => {
// const a = document.createElement("a");
audio.src = URL.createObjectURL(new Blob(blobs, {
type: mimecodec
}));
// a.download = words.join("-") + ".webm";
// a.click()
})
.catch(err => console.log(err));
});
<textarea>what it does my ninja?</textarea>
资源位于维基共享资源类别:公共领域 https://commons.wikimedia.org/wiki/Category:Public_domain不需要从同一目录提供服务,请参阅如何检索维基词典单词内容? https://stackoverflow.com/questions/2770547/how-to-retrieve-wiktionary-word-content, 维基百科 API - 单词的含义 https://stackoverflow.com/questions/4175533/wikionary-api-meaning-of-words.
如果知道资源的精确位置,则可以请求音频,尽管 URL 可能包含单词本身以外的前缀。
fetch("https://upload.wikimedia.org/wikipedia/commons/c/c5/En-uk-hello-1.ogg")
.then(response => response.blob())
.then(blob => new Audio(URL.createObjectURL(blob)).play());
不完全确定如何使用维基百科API https://en.wiktionary.org/wiki/Special:ApiSandbox, 如何使用维基百科的 API 获取维基百科内容? https://stackoverflow.com/questions/7185288/how-to-get-wikipedia-content-using-wikipedias-api, 仅获取音频文件。这JSON
响应需要解析以结尾的文本.ogg
,那么需要对资源本身发出第二个请求。
fetch("https://en.wiktionary.org/w/api.php?action=parse&format=json&prop=text&callback=?&page=hello")
.then(response => response.text())
.then(data => {
new Audio(location.protocol + data.match(/\/\/upload\.wikimedia\.org\/wikipedia\/commons\/[\d-/]+[\w-]+\.ogg/).pop()).play()
})
// "//upload.wikimedia.org/wikipedia/commons/5/52/En-us-hello.ogg\"
哪个记录
Fetch API cannot load https://en.wiktionary.org/w/api.php?action=parse&format=json&prop=text&callback=?&page=hello. No 'Access-Control-Allow-Origin' header is present on the requested resource
当没有来自同一来源的请求时。我们需要尝试使用YQL
再次,尽管不确定如何制定查询以避免错误。
第三种方法使用稍微修改的版本meSpeak.js
无需发出外部请求即可生成音频。修改是为创建适当的回调.loadConfig()
method
fetch("https://gist.githubusercontent.com/guest271314/f48ee0658bc9b948766c67126ba9104c/raw/958dd72d317a6087df6b7297d4fee91173e0844d/mespeak.js")
.then(response => response.text())
.then(text => {
const script = document.createElement("script");
script.textContent = text;
document.body.appendChild(script);
return Promise.all([
new Promise(resolve => {
meSpeak.loadConfig("https://gist.githubusercontent.com/guest271314/8421b50dfa0e5e7e5012da132567776a/raw/501fece4fd1fbb4e73f3f0dc133b64be86dae068/mespeak_config.json", resolve)
}),
new Promise(resolve => {
meSpeak.loadVoice("https://gist.githubusercontent.com/guest271314/fa0650d0e0159ac96b21beaf60766bcc/raw/82414d646a7a7ef11bb04ddffe4091f78ef121d3/en.json", resolve)
})
])
})
.then(() => {
// takes approximately 14 seconds to get here
console.log(meSpeak.isConfigLoaded());
meSpeak.speak("what it do my ninja", {
amplitude: 100,
pitch: 5,
speed: 150,
wordgap: 1,
variant: "m7"
});
})
.catch(err => console.log(err));
上述方法的一个需要注意的是,在播放音频之前加载三个文件大约需要 14 秒半的时间。但是,避免外部请求。
1)创建一个FOSS https://en.wikipedia.org/wiki/Free_and_open-source_software,开发人员维护常见和不常见单词的数据库或声音目录; 2) 进一步开发meSpeak.js
减少三个必要文件的加载时间;并使用Promise
基于方法来提供文件加载进度和应用程序准备情况的通知。
根据该用户的估计,如果开发人员自己创建并贡献一个在线文件数据库,并以特定单词的音频文件进行响应,那么这将是一个有用的资源。不完全确定是否github https://github.com是托管音频文件的合适场所吗?如果对此类项目表现出兴趣,则必须考虑可能的选择。