金山云苏驰:人工智能在内容安全场景下的应用实践

2018-12-04 14:00:03来源:众视媒体 作者:张樑热度:
2018年11月28日,第六届中国网络视听大会在成都盛大召开,大会以“凝心聚力 创造美好新视界”为主题,邀请300余位重量级业界嘉宾进行分享交流。11月30日下午,由金山云承办的“AI赋能 俯瞰视界”人工智能应用发展论坛上,金山云金睛AI首席算法架构师苏驰博士做了题为《人工智能在内容安全场景下的应用实践》的演讲,通过对金山云的一站式AI内容服务“金睛”的详细介绍,分享“金睛”是如何化解与内容安全相关的成本、技术、效果这些痛点的。

图为 金山云金睛AI首席算法架构师苏驰博士
 

金山云的全方位内容安全监管
 

目前我国的网民已经超过8亿,互联网的普及率接近60%,这也导致每天产生海量的网络视频的文本,其中不乏一些暗流,也就是所谓的黄色、恐怖、违规、或者是涉政敏感的内容,所以内容安全是整个企业的生死线也是国家监管的红线。
 

而针对这一现象,过去的解决方法主要以人工审核和用户举报为主,但是效果并不明显,苏驰介绍到:“金山云的内容安全监管是全方位的,包括文本、语音、图像、视频等。”
 

首先对于文字来说,金山云有大量的数据可以进行语音分析和深度学习的处理,把涉政,色情、暴恐以及隐藏特别深晦的东西分析出来。
 

金山云“金睛”在云服务的丰富底层资源上,借助每日千万级海量图片库训练出精准AI算法模型,对违规场景进行精细化标签,目前分别支持80+低俗和色情场景、200+暴恐类标签识别、1200+敏感人物等六大违规场景的精准识别,10亿精标数据,毫秒级响应速度,即发即审,免去平台突发的内容风险。
 

除此之外,金山云也开发了人脸识别系统,包括主播黑名单和主播白名单,主播白名单有主播的身份库,直播的时候需要先进行认证。而一旦进行了黑名单,通过人脸识别之后,直播的内容将无法播放,这是对于直播平台主播实时的监控系统。
 

不仅如此,图像和视频处理完之后还将通过相关的语音识别技术,看看有没有主播诈骗的信息,语音转写时有无敏感词等等。
 

图像分类和OCR文字识别技术
 

先前讲到内容监管应该怎么做,但是遇到问题时该怎么解决呢?目前每天在互联网上都会有黄色和恐怖的图片,但是样本非常小,其次标签规也不统一。苏驰介绍说:“金山云采用的是图片分类技术为多模态分析,该技术同时针对包括图像、文本和语音,只要这三条有一条不合格就不行。”
 

说到多模态分析,苏驰以视频举例到:“我们对视频进行统一分析,首先得到图片,我们会图片分类过OCR产生文本,然后得到音频信息,音频信息要过音频分类,这四块处理之后我们只要找到一个进行违规我们会输出违规反馈给客户,同时告诉客户我们在哪块进行违规,这个到底是因为什么原因违规。”
 

另外开放数据带来的问题网络图片、分辨率、码流、码率完全不一样,有可能特别小的手机截图,或者是4K的截图,或者是一个微信长视频的截图,这块我们怎么处理,我们会有一个尺度判断,来一张图片之后我们对尺度判断,通过判断会把它放到不同的分辨率进行预测的结果。
 

OCR文字的识别技术主要检测的是长视频弹幕。苏驰介绍到:“对于文本处理我们有多旋转方向的文本检测模型做训练,同时会采集生成达到千万量级的标准做文字检测。”
 

精准度+全维度的内容监管优势
 

金山云对于内容监管有核心优势体现在精准的识别度以及全维度的解决方案,苏驰表示:“我们训练数据级达到百亿,无论是视频直播、点播、软视频、资讯类的内容我们都有不同场景的模型做专业的配置。”
 

不仅如此,金山云线下有专业的售后专家团,每天的日报,每周的周报,每月的月报都会对公司业务进行重新的修正。

责任编辑:张樑