污水泵厂家
免费服务热线

Free service

hotline

010-00000000
污水泵厂家
热门搜索:
行业资讯
当前位置:首页 > 行业资讯

Autotiming让声音可逐句搜索视频内容碎片化分享

发布时间:2021-01-20 02:08:03 阅读: 来源:污水泵厂家

Autotiming是一个语音-文字匹配程序产品。最直接的效果是,它改变了两件事:视频、音频字幕的制作不用再人工逐字逐句校对匹配;另外,让语音搜索更智能。这个搜索不是通过视频、音频的标题或者标签文字,而是里面的每个词、每句话都可以作为视频搜索的线索。

这个产品由两名从事语音识别自主创业7年的科学家开发,曾分别供职于英特尔声音研究院和中科院声音研究所。而在此这前,语音分析领域已经对这个技术研究了27年。松禾资本的投资总监张春晖是其投资人。

经常看剧的朋友会注意到一点,在职员表里会有一个部门:字幕中心。他们的工作就是为视频甚至音频节目配上字幕。简单地说,他们的工作流程就是把文字脚本和声音一句一句地匹配上,然后编码在一起。如果文字脚本是要翻译的,比如美剧、韩剧等,则是先录下原来的字幕并标记时间,一句句翻译出来之后,再逐一对应。这个对应过程还需要人工调整字幕显示时间,而这个时间轴的调整通常是以毫秒为单位的,非常繁琐。

Autotiming的做法是通过技术手段,把音频或者是视频的语音句子分解成单词,然后将单词语音与文字词语对应起来。即把句对句变成了词对词。这样的效果是文字匹配和时间轴对应都更准确,并大大节省人力,提高效率。同时,反过来,由于文本信息与语音信息段节点的逐一对应,这就相当于把声音素材转换成一个文本信息库,于是可以用文字来检索视频内容。比如,直接搜某一个词句,就可以直接检索到视频或音频中间的某一个位置。类似于word里的查找效果。而不需要逐句逐句地翻下去。

并且,可以选择一定的文字范围,再点击分享,就可以将对应的这段视频内容分享出去。

这项技术的应用可能一些朋友已经接触过了,比如新东方在线教育,通过文字可以搜索网络课程的要点,就是运用的这项技术。

(图:创新中国2013文化创意专场,Autotiming团队现场展示)

群英会游戏官方最新版

567彩票图片

游戏茶菀