多模态深度语义理解:让AI从“看清听清”到“看懂听懂”_央广网

2018-09-22 11:07

  央广网科技7月5日消息(记者 殷雨婷) “多模态深度语义理解能让机器听清、看清,更能深入理解它背后的含义,深度地理解真实世界,进而更好地支撑各种应用。”百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰表示。

  日前,在百度AI开发者大会(Baidu Create 2018)上,王海峰发布百度大脑3.0。百度大脑3.0的核心是“多模态深度语义理解”,包括数据的语义,知识的语义,以及图像、视频、声音、语音等各方面的理解。

  如何实现从“看清听清”到“看懂听懂”?

  视觉语义化可以让机器从看清到看懂视频,并提炼出结构化语义知识,新版跑狗图每期更新。百度视觉技术部、人脸技术部、增强现实技术部总监吴中勤介绍,视觉语义化技术首先识别人、物体和场景,同时捕捉它们之间的行为和关系,通过时序化、数字化、结构化的方式形成语义知识,最终结合领域和场景进行智慧推理,落地行业应用。

  未来,视觉语义化技术还可进一步延展,它结合新型的传感器和AI芯片,可以在感知层面和计算层面得到大幅提升;结合手机可以带给用户更佳地使用体验。

  语音技术的升级则让机器更好地听懂世界。百度语音技术部总监高亮表示,百度基于远场的语音语义一体化技术已取得突破,可为业界提供更顶尖的远场语音技术。

  语音语义一体化将远场交互中高频Query识别准确率提升10个点,并保持普通Query识别率不降;多语种混合声学建模基于Deep Peak2大幅提升中英文混合Query识别准确率,相对错误率比业界最好竞品降低20%;新升级的TTS技术业界首创传统拼接技术与Wavenet技术融合方案,保证合成质量的同时大大降低成本,让大规模应用落地成为现实。

  在对话理解方面,百度理解与交互技术平台UNIT升级至2.0,进一步增强冷启动能力,支持像人类一样在对话当中学习,同时开放了第一个工业级对话系统开源框架,降低搭建门槛,让开发者无缝对接云端。

  将自主研发的芯片纳入技术体系

  数据、算法、算力是影响人工智能技术发展的重要因素。王海峰表示百度大脑3.0首次将芯片纳入技术体系,带动百度大脑算力爆发式增长。百度自主研发的中国第一款云端全功能AI芯片“昆仑”也在会上首次亮相。未来,AI芯片将与百度自主研发的PaddlePaddle深度学习框架相结合,推动百度AI产业生态快速发展。

  百度在2016年正式开源的PaddlePaddle,如今也迎来了PaddlePaddle3.0版本。百度AI技术生态部总经理喻友平对此进行了详细解读。PaddlePaddle3.0包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以让开发者获取AI能力的平台。

  PaddlePaddle3.0核心框架对服务器版本以及移动端版本进行了全面优化,PaddlePaddle Fluid提供丰富的满足常见主流模型搭建需求的API,支持广泛的模型搭建,训练Runtime可以满足各类型的模型训练需求;PaddlePaddle Serving可灵活适配多种预测引擎;PaddlePaddle Mobile集成百度移动端预测的实践经验,提供多平台支持。

  百度大脑升级至3.0是百度AI技术的一次跨越式升级,王海峰强调,“百度AI能力的核心是百度大脑,百度大脑3.0是百度AI能力的集大成者。”未来,百度将逐步把基于百度大脑的技术突破开放给相关的开发者和企业。

今日排行

  • 第十一中学喜迎2018级新生
  • 习近平会见连战一行__南方网
  • 习近平要求乡村实现“五个振兴”_中
  • 只投了交强险的豪车到底该谁赔?
  • 识别新型网络传销:“金融创新”背
  • 宁波壹加壹整形美容(宁波唯一国家5
  • 治理房地产乱象须出“重拳”_央广网
  • 再见,大班额!_新闻频道_中国青年
  • 冠中冠赛-霍金斯4-1胜希金斯 将与丁
  • 嘉莲街道“平安校园维权联盟”启动
  • 国产十亿亿次超级计算机_央广网
  • 习近平谈如何做到心中有党__南方网
  • 随便看看

  • 车主不满保险公司延迟赔付 退保怎
  • 北京 有户籍无房家庭子女可在租住
  • 未上牌机动车出险 保险公司被判赔
  • 冠中冠赛-霍金斯4-1胜希金斯 将与
  • 【脱贫攻坚在行动】13家新媒体“
  • 我市赴区外招才引智_中国南宁
  • 今年中考八类考生可获5分至20分不
  • 习近平会见连战一行__南方网
  • 嘉莲街道“平安校园维权联盟”启
  • 南宁市地税收入突破190亿元_中国
  • 西乡塘区三大建设工程打造生态忠
  • 南宁外环高速公路12月26日建成通