您所在的位置:长三角网首页 > 财经企业 > 科技频道> 浏览正文


百度语音识别上线新版本 长语音转写告别时间限制


 
2017-10-11 14:43:02

当语音输入不再受时间的限制,用户是否可以真正实现“动口不动手”?近日,百度AI开放平台向开发者免费开放长语音识别功能,通过SDK调用服务,可将长语音转换为文字。据了解,新版本SDK解除了对时间的限制,开发者无需再将长语音切割成60秒以内的分段,进行调用,提升了转写的效率和语音识别的体验。对于用户来说,新版本告别之前60秒的“束缚”,可根据需要自行把控时间,极大地提高了灵活性。

随着用户对移动端语音功能需求的增长,开发者也开始纷纷将产品接入语音功能。目前,开发者多通过第三方接入语音识别技术,以减少研发时间、降低研发成本。但是,大部分公司提供的语音识别功能有时间限制,类似会议录音、长语句等长语音识别成了难题,虽然市面上存在一些长语音识别技术支持方,但开发者需要为此支付大笔的技术接入费用,徒增业务成本。
对于用户,受“60秒”限制的语音识别功能往往无法满足他们在生活、工作中的需求,这不仅影响他们使用语音识别功能的“兴致”,同时会导致用户对一些搭载了语音识别功能的产品“敬而远之”。
为解决这些痛点,百度基于原有语音识别技术,新增长语音识别功能,让语音识别不再局限于60秒,并且为开发者免费开放。比如开发者可将长语音识别用于会议记录、实时字幕和语音笔记等场景,让产品实现不同时长的音频转换为文字信息,或将直播、视频、现场演讲等音频进行实时字幕转换等功能,方便后期文字处理和内容存档,省去记录的人力和时间成本,大幅提升了转换效率,给予开发者和用户更好的使用体验。
百度长语音识别适用于安卓SDK、iOS SDK,均在原有的离在线融合SDK上升级,开发者可根据不同情况接入百度长语音识别功能。目前,开发者可登陆百度AI开放平台(ai.baidu.com),在“SDK下载”界面中,下载体验百度长语音识别功能。

编辑: 深度行动 · 长三角网 changsanjiao.com.cn 关闭
+ 相关信息咨讯
·“手机 + XR + 汽车” 全生态出海 星纪魅族加速冲
·约500款上海App已完成鸿蒙化创新升级,鸿蒙生态在
·中国已成为全球人工智能专利的最大拥有国
·人工智能与软件双向赋能 第四届中国国际软件发展
·神舟二十号3名航天员顺利进驻中国空间站
·机器人马拉松:人类的想象力在奔跑
·“钢铁侠”VS“小精灵”!机器人马拉松谁跑得更快
·教育部等九部门印发《关于加快推进教育数字化的意
·世界上最难接头的网约车在高铁站?南京苏州杭州用
·重磅发布、合作签约 2025中关村国际技术交易大会
版权与免责声明:
1. 深度行动 · 长三角网 changsanjiao.com.cn自身不采编任何新闻信息,本站所载作品均转载自境内其他合法网站,本站不刊发涉政治、国际、时评、贸易争端、涉外涉港澳台文章。
2. 本站刊载之作品,均来自我站会员在线投稿,全部转载自其它媒体,转载目的在于传播信息,不代表本网观点,本网不承担直接责任及连带责任。
3. 因难以对所有会员投稿文章事前版权筛查,如因作品内容、版权等被侵权需本网删除的,请根据“避风港原则”在作品在本网发表之日或发现被侵权之日起30日内务必发邮件law###shzx.com(发送时请将###更换为@)书面通知我站,若未书面通知我站不负法律责任。

版权所有 Copyright ©2017-2025 深度行动 · 长三角网 changsanjiao.com.cn All Rights Reserved. 网络作品传播权及著作权声明
媒体合作(发稿采访发布会等)电话:021-3412 1912 微信:yuanfangnet 

 

工信部ICP备案号:沪ICP备2025120599号-2