剑客
关注科技互联网

极限元马骥:深耕行业定制化语音服务,为即将到来的AI行业寒冬做准备

极限元马骥:深耕行业定制化语音服务,为即将到来的AI行业寒冬做准备

在使用高德地图时,你有没有想过明星语音包是如何制作的?

近日,亿欧采访到人工智能公司极限元的联合创始人马骥,作为语音行业资深人士,他对这个问题给于了解释。

“我们公司也提供定制化语音服务,例如不同高低音的男音、女音,以及儿童和老年人的声音,通常的做法是将上万句话录制下来,但是明星语音包不能用这个方法。”马骥说到。

“因为明星的时间成本较高,不可能消耗十几天的时间来单独做这项工作。以高德地图里林志玲的声音为例,高德是找专人,跟了志玲姐姐几个月,贴身录音,但是收集的录音也不够,他们还会把林志玲在视频、音频节目中的声音收集下来,然后把这些原始声音文件处理提取出数字特征,再完成语音合成。”

极限元马骥:深耕行业定制化语音服务,为即将到来的AI行业寒冬做准备

极限元全称是极限元(北京)智能科技股份有限公司,是一家致力于发展人工智能技术的公司,主要为行业用户提供智能交互式语音技术、机器视觉等整体解决方案。团队于2014年8月正式运营,目前成员50余人,创始人为雷臻、马骥、康利强。公司技术解决方案已广泛运用于国家网信办、公安部、教育部、联想、搜狗、奇虎360、国家电网等各大公司的核心产品中。

身为极限元联合创始人的马骥曾先后就职于中科软科技、华为,任职网络安全解决方案专家,并曾在上海创建手机游戏开发团队,具有丰富的商务经验和项目管理经验。作为语音行业创业者,马骥对国内语音行业,乃至整个人工智能行业提出了独到的见解。

人工智能行业即将进入寒冬

今年最火的领域便是人工智能,而人工智能行业里机器人又是最火的。机器人的两大主要技术,智能交互式语音技术和机器,都是极限元目前的主营业务,因此马骥也看到了机器人行业的乱象。

马骥表示:“国内已经出现了近千家机器人公司,但是真正能够把项目落地,产品落地的企业屈指可数, 我相信未来两年,整个人工智能行业会面临一次大清洗,会有90%的企业被淘汰掉。

由于人工智能行业里能满足强需求的企业很少,而能把这些需求落地,实现商业化的企业就更少,因此许多做技术整合、拉风投的企业,未来一定会面临困境,所以接下来就是整个人工智能行业的寒冬。马骥坦言,极限元会提前做一些技术储备、人才储备,以应对即将到来的行业动荡。

国内语音技术实践经验更多,数据来源是中小企业的迫切需求

此外,马骥还点评了国内语音行业的发展情况。

语音方面,国内外的差距并不大,甚至在某些方面中国还比国外有优势。马骥回答:“目前国外领先的是算法,但是最好的实践都在中国,由于汉语包含多音字和同音词,而且受到口音影响,因此汉语处理起来更加困难,以致国内企业在实践方面要领先国外。”

这种实践优势让国内语音行业的几家寡头企业开始显现,例如科大讯飞、搜狗、百度等。目前,极限元跟其中的搜狗、360、汉王科技等巨头公司也建立了合作,为它们提供语音合成方面的技术,即文字转换成语音的过程。

由于几家巨头都有各自的数据来源,例如输入法、搜索引擎等,因此它们在语音转换成文字的识别方面有着巨大优势。 马骥表示,数据来源对于中小语音企业来说是一个迫切需求,当前的解决方法主要是依靠自己采集、购买,或者是同其他语音企业进行资源的互换。

也正是因为数据来源的限制,极限元没有选择BAT等大企业提供的通用领域语音服务,而是提供针对各行业的语音解决方案,例如医疗行业、信息安全行业、教育行业等。

行业+语音技术:国内刚刚起步,技术门槛较高

马骥表示,行业的语音解决方案是国外的Nuance做得最好,其40%左右的销售收入来自于医疗等行业的语音解决方案,而且Nuance已经做了很多年, 国内这方面是今年下半年才开始,此前各公司都在做技术研发。

那么,语音技术是如何在各行业内应用的?我们可以从极限元的各行业解决方案中找到答案。

在医疗行业,极限元提供病人信息录入的语音解决方案,让医生可以口述病历,语音录入转写,节约大量人力成本。要实现这个功能,技术人员会提前把大量的医学名词和药名进行模型优化,然后输入训练,实现较高的识别率。据马骥透露,目前公司与某三甲医院合作,为其提供一个国内最全的中文医学名词库,并根据词库提供了一些语音服务。

在教育行业,极限元提供语音测评服务,主要是针对中小学生的古诗词诵读测评和英语测评,以及方言教学。目前,极限元跟语文出版社合作研发了两款APP,其前台交互和后台技术都是由极限元提供。

极限元马骥:深耕行业定制化语音服务,为即将到来的AI行业寒冬做准备

在信息安全行业,极限元跟国家网信办、公安部门合作,提供有害信息的过滤。语音方面是通过语音内容智能分析,判定通话是否为诈骗电话,音频是否包含有害信息。此外,极限元的计算机视觉识别技术也应用到了视频监管中,在各大直播平台中,鉴黄、鉴暴成为了规范行业的迫切需求,极限元提供的敏感视频监测和可达到99%的准确率,替代监管方面90%的人力。

提到计算机视觉识别,极限元年底会推出一款监测驾驶员疲劳度的硬件。马骥表示,这款硬件主要是面向长途客运、货运、交通监管部门,产品通过融合语音、人脸等多模态特征的深度网络模型,来确定驾驶员疲劳度,减少运输行业的潜在风险。

最后,亿欧问到了语音定制化服务的接受程度,马骥表示,由于国内语音行业解决方案刚刚起步,大部分语音企业的业务都在接洽,并没有全面开始,这是由于医院、法院等公立机构要求的技术门槛也高,需要语音企业在其中挖掘得足够深。极限元依其技术深度,在接洽用户时发现了许多新需求,并满足了新需求,积累了一批优质客户。

推荐阅读:

一家工业机器人企业的那些年:拓斯达的转型升级之路

机器人让人失业的理论别轻信,学会驾驭协作机器人才是正经事

大数据+金融成最热,4位优秀创业者解读国内大数据行业的机会

极限元马骥:深耕行业定制化语音服务,为即将到来的AI行业寒冬做准备

2016年最后一场行业盛会,第二届创新奖评选再度来袭,12月23日,北京亮马桥四季酒店,见证新资本、新产业、新技术、新理念带来全新变革。科技赋能产业,见证下一个商业风口!

极限元马骥:深耕行业定制化语音服务,为即将到来的AI行业寒冬做准备

本文作者宋少卿,亿欧专栏作者;微信:zzb0930(添加时请注明“姓名-公司-职务”方便备注);转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址