会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 人工智能黎明将至?百度开放语音技术接口!

人工智能黎明将至?百度开放语音技术接口

时间:2025-05-05 00:14:10 来源:索垢吹瘢网 作者:娱乐 阅读:286次

导读:人工智能一直是人工热门讨论话题,在刚刚过去的黎明互联网大会上,百度公布了自己的将至技术接口人工智能进展,并且于日前宣布将开放情感合成、百度远场方案、开放唤醒二期技术和长语音四种技术。语音


日前,人工百度宣布在其语音开放平台上线三周年之际,黎明向公众开放四项全新语音技术接口,将至技术接口分别是百度情感合成、远场方案、开放唤醒二期技术和长语音。语音

记者注意到,人工作为人工智能的黎明主要技术及应用之一,语音识别是将至技术接口国内外科技公司都在耕耘的方向。百度公司首席科学家吴恩达甚至形容称,“我们已经站在人工智能的黎明。”

早些时候,谷歌于今年3月宣布开放其语音识别API(应用程序编程接口)。

据了解,百度语音开放平台日前宣布对外开放的四项技术,也可以理解为输出解决方案,包括情感合成、远场方案、唤醒二期技术和长语音四种。

“这些技术有很大的潜力,去彻底改变人机交互的效率和办法。未来语音技术在很多应用场景有很好的机会,将为人机交互带来巨大的改变。”吴恩达表示,这些技术旨在解决用户在使用语音交互的场合时,普遍感到困扰的一些关键问题。例如,百度情感合成技术主要聚焦在为合成语音“加入情感”,目前可达到接近真人发声效果。类似地,开发者还可以利用新的接口,使语音识别距离增加到3米到5米,将设备的语音唤醒率提升到95%以上,同时更省电、误报更少,或提升长时间语音识别的准确率问题。这将为语音技术带来远比现在更多的想象空间,而不只是遥控电视或解锁手机。

公开资料显示,百度语音识别准确率已达97%。百度语音开放平台自2013年10月上线以来,开发者数量超过14万。

斯坦福大学人工智能专家James Landay提到,“近两年,受益于大数据和深度学习技术的不断发展,语音识别技术突飞猛进,速度及准确性都有了长足进步。”

值得注意的是,作为人工智能的主要技术及应用之一,语音识别是国内外科技公司都在耕耘的方向,包括苹果、微软、谷歌、百度、腾讯、科大讯飞和搜狗等多家公司都在这一领域发力。

“我们已经站在人工智能的黎明。”11月22日下午,吴恩达在接受包括媒体采访时称,语音识别的门槛很高,除了技术复杂,数据门槛也非常高。现阶段,最难的仍是核心技术研发,如识别率提升、大数据语音合成等。百度希望通过开放相关技术,让智能应用更易被开发。

另一方面,今年3月,谷歌在其Next云计算大会上发布面向开发者的新机器学习平台的同时,宣布开放语音识别API,即谷歌语音搜索和语音输入的支持技术。

记者留意到,Google Cloud SPeech API包括了80多种语言,适用于各种实时语音识别与翻译应用。9月下旬,外媒报道称,谷歌宣布将收购智能语音识别工具开发商API.ai,预计会整合后者的自然语言理解技术。

而就在上周的第三届世界互联网大会上,王小川在演讲中现场演示了实时语音识别和翻译的能力,并提到,搜索的未来就是问答机器人,随着技术的突破,搜索引擎会自然而然演化成为问答引擎。但他也直言,尽管人工智能最重要的突破领域是在语音和图像领域,但在文字领域的进展仍较缓慢。比如,在安静的环境下,搜狗的语音识别准确度已经到了95%甚至97%,但一旦有噪音,准确率会迅速下降。

(责任编辑:探索)

相关内容
  • 《八方旅人》IGN评分9.3 switch平台独占神作
  • 逃家的阿N和黑法师的故事
  • 侠客风云传前传螺旋生死符获得方法分享
  • 《英魂之刃心袋版》66节狂悲庆典:豪杰、皮肤大年夜放支 1开特惠去袭
  • 起猛了?秦时明月和铠甲勇士一起拍电影!国产第一IP宇宙击破多厨次元壁
  • 影子武士2双持突击步枪方法分享 影子武士2怎么双持武器
  • 鼠鼠课间历险记的故事
  • lol2016全球总决赛10月7日ANX vs ROX文字战报 1:0
推荐内容
  • 《一起来扫雷》增强版登陆Steam 限时九折优惠
  • DNF异界改版E2兰蒂卢斯的鹰犬改了什么
  • 侠客风云传前传奇怪的秘籍在哪买 奇怪的秘籍有什么用
  • CFPLS9豪门盛宴活动地址 S9总决赛购门票送黄金套装
  • 嘉奖再再再进级!正在魔域心袋版相遇女神
  • 黑手党3炸药在哪买 黑手党3炸药获得方法分享