AI能看懂英文,阿里巴巴夺实体发现测评全球第一

2017-11-27 09:18:32来源:雷锋网 热度:
全球顶级的知识库构建测评KBP2017日期公布了最新排名。阿里巴巴人工智能研究机构iDST斩获英文实体发现测评全球冠军,在准确率和召回率上均表现出色,核心指标F1达到0.811。这次测评吸引了全球20多支顶尖团队参与,包括IBM Research, BBN, Stanford Univ, CMU Univ, UIUC Univ, Columbia Univ, 腾讯等。
 
KBP是由NIST(National Institute of Standards and Technology,美国国家标准与技术研究院)指导、美国国防部协办的赛事,主要任务为从自然书写的非结构化文本中抽取实体,以及实体之间的关系。
 

 
这项测评要求AI算法在“读完”一篇英文文章后,构建一个物理世界的命名实体和实体之间关系的知识库,如“克林顿和希拉里之间是夫妻关系”、“克林顿毕业于耶鲁法学院”这样一个个实体的关系。
 
阿里巴巴iDST自然语言处理首席科学家司罗介绍,他们的算法可以做到对文章上下文的理解。比如,文章出现了Apple,再出现Jobs,就可以辨别出这个Jobs指的是乔布斯,而不是工作。再比如,文章出现了Microsoft,那么Apple就更有可能是苹果公司,而不是一种水果。
 
“另外,我们构建了一个算法去学习不同领域之间共同的部分,通过迁移学习提升我们学习的准确度。对于不同领域数据,我们取其精华,去其糟粕,进行智能学习”,司罗说。
 
在这次测评中,iDST团队采用经过改良的深度神经网络架构对文本进行理解。改良的架构有三个主要特点:首先该模型可以自动阅读海量文章(如维基百科)并从中汲取经验;其次,该架构可以智能选择训练数据集以保证训练数据的准确性;最后,我们采用post regularization的办法保证模型结果的一致性。
 
对于KBP2017的成绩,司罗表示:“很荣幸能够同全球的同行分享阿里巴巴的研究成果,人工智能在机器阅读理解和知识库构建上还处在起步阶段,我们正在积极和同行业顶尖机构学习交流,推动行业发展。比如我们内部建设的信息抽取平台AliIE项目就在同斯坦福大学展开积极合作”。
 
阿里巴巴正在将这样的信息抽取技术广泛的应用到实际业务当中,并致力于让更多的中小开发者从中收益。他们搭建的信息抽取平台AliIE拥有最顶尖的AI技术,并从一开始的架构设计就考虑到平台的开放性和可扩展性。可以让更多的开发者、研究员共同开发,并将成果回馈给这个社区。
 
 
阿里巴巴iDST自然语言处理首席科学家司罗
 
司罗是全球权威机器智能学者,曾担任美国普渡大学计算机系终身教授,主持的20余个项目得到美国政府、工业界资助,先后获得美国国家科学基金会成就奖、雅虎、谷歌研究奖等。
 
由他领导的自然语言处理团队目前支持了阿里巴巴大生态每天多达600亿次的自然语言处理需求,团队横跨杭州、北京、硅谷、西雅图(新加坡)多地,成员大多拥有10年以上的研发经验。检索招聘网站可以看到,他们依旧在不断扩充团队。

责任编辑:黄焱林

为您推荐

三网融合诱人 相关企业尝鲜

内容摘要:“三网融合的总体方案国务院已批准公布,试点方案已报国务院,试点城市工作已经启动。根据国务院公布的三网融合方案,电信部门将和广电部门展开深度合作,内容方面由广电部门监管。“三网融合的总体方案国务院已批准公布,试点方案已报国务院,试点城市工作已经启动。将会同广电总局等部门抓好试点示范,推动‘双向进入’……推进三网融合取得实质性进展。”6月29日,工信部部长李毅中在其内部争先创优座谈会讲话中透露说。而对于试点城市有哪些,工信部尚未公布。对此,记者采访得知,不少相关企业已经闻风而动,快速应变。用遥控器打电话,在手机上看电视何为三网融合?能给

阿里巴巴云战略:推自有手机 控制云管端

7月4日消息,阿里巴巴在无线领域的布局有多大?目前,阿里浏览器、阿里输入法、手机旺旺、搜索、邮件服务器等应用已研发完成,它们将与手机支付宝,一起打包装进天宇定制手机,而该手机的操作系统也由阿里巴巴自主研发。此外,在云端,分布式系统、弹性计算平台等基础设施的搭建也有条不紊。在电子商务的另一边,一个由阿里巴巴控制的“云、管、端”时代将要来临。2009年9月,阿里巴巴云计算公司“阿里云”在猜忌与争议中成立。团队班底来自原阿里软件、阿里巴巴集团研发院等底层技术团队。阿里巴巴集团首席架构师、阿里集团研发院院长王坚负责“阿里云”的研发工作。在当时,涉足云计算的企业主要是国外IT巨头,布局的公司有微软、Go

阿里巴巴云手机系统“启动”

28日,在上海举行的2011第九届ChinaJoy展会上,阿里巴巴“淘女郎”在展示阿里云手机。成立三年之后,阿里巴巴集团旗下最神秘的阿里云计算有限公司终于揭开了面纱。昨日,阿里云公司在北京推出独立研发的阿里云操作系统——阿里云OS,同时发布搭载该系统的首款智能手机——天语云智能手机W700,该手机采用英伟达Tegra2硬件平台,售价2680元,将于月底发售。这意味着,阿里巴巴将成为中国首家推出手机操作系统的互联网企业。据阿里巴巴介绍,阿里云OS不仅是国内首家以云计算技术为核心的、同时支持数据中心和手机终端的互联网平台,也是云计算技术在国内移动终端的首次大规模产品化应用。“不会介入手机生产”“我

云计算和移动互联网会三大创业机会

10月24日,首届中国互联网无线化峰会暨阿里云开发者大会在杭州举办,阿里云在会上发布了包括云开发者平台、阿里云邮箱、云搜索等产品,阿里巴巴集团首席战略官曾明,阿里巴巴集团首席架构师王坚,易观国际董事长兼CEO于扬等业内人士在大会上做了主题演讲。对于未来围绕着云计算和移动互联网会,于扬总结认为有三大创业机会:第一个,从应用的角度来讲,有三个层次上的应用,第一个应用是技术性的,比如我们看到一些安全的防护,第二个是工具类,比如说省电的工具,第三类是社交类的,如果找到一种能够让用户花更多的感情和时间的产品,意味着创业者不用惧怕大企业,你越早进入这个市场,用户在上面花的时间越多,那用户的黏性越强,这时候