注册
登录
看啥推荐读物
专栏名称:
机器之心
专业的人工智能媒体和产业服务平台
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
知乎回答RSS订阅方法
知乎专栏 RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
量子位
·
惨!Rabbit ...
·
昨天
爱可可-爱生活
·
【go-size-analyzer:用于分析 ...
·
2 天前
爱可可-爱生活
·
恭喜@只因我颠倒了辉煌_willschang ...
·
6 天前
爱可可-爱生活
·
【Panza: ...
·
6 天前
爱可可-爱生活
·
【XCap:用 Rust ...
·
1 周前
今天看啥
›
专栏
›
机器之心
业界 | 谷歌为YouTube添加新功能:利用机器学习自动生成音效字幕
机器之心
·
公众号
·
AI
· 2017-03-24 11:36
选自Google blog作者:Sourish Chaudhuri机器之心编译音频(audio)对于我们对世界的感知的影响的巨大自然不言而喻。语音(speech)显然是人们最熟悉的通信方式之一,但环境声音(sound)也能传达很多重要的信息。我们可以本能地响应这些背景声音所创造的语境,比如被突然出现的喧闹而吓到、使用音乐作为一种叙述元素或者在情景喜剧中将笑声用作一种观众提示。自 2009 年以来,YouTube 就开始为视频提供自动生成的字幕了,而这主要是专注于语音转录以使 YouTube 上托管的内容能触及到更多人。但是,没有对视频中背景声音的类似转录,视频中的很多信息和效果都无法单独使用语音转录获取。为了解决这个问题,我们宣布为 YouTube 视频 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
分享到微博
推荐文章
量子位
·
惨!Rabbit R1被持续扒皮:AI风口一夜转型,NFT充值用户欲哭无泪,动作大模型也是套壳的
昨天
爱可可-爱生活
·
【go-size-analyzer:用于分析编译后的 Golan-20240505134132
2 天前
爱可可-爱生活
·
恭喜@只因我颠倒了辉煌_willschang 等3名用户获得【《-20240501150506
6 天前
爱可可-爱生活
·
【Panza: 私人电子邮件助手,通过在设备上训练和运行,定制化-20240501155433
6 天前
爱可可-爱生活
·
【XCap:用 Rust 编写的跨平台的屏幕捕获库,它支持 Li-20240430123845
1 周前
牧夫天文
·
美国宇航员尿着裤子上天、牧师打败爱因斯坦,BBC推出现实版天文科普
1 年前
结构学
·
A420:你需要重新理解市场!
3 年前
西西弗评论
·
凭什么外国人拿着这个东西卖给中国人就是天价?山东小伙一语道破
3 年前
北大清华讲座
·
6.18-6.22(周一-周五)讲座41场【复杂活性天然产物全合成】【动态竞合: 前沿研究与未来发展方向】
5 年前
枪稿
·
21克拉的迪丽热巴不是女神,是女神经
6 年前