雷刚 发自 LV量子位 出品 | 公众号 QbitAI

CES期间,腾讯也有一些AI相关的信息对外发布。

在腾讯众创空间的一个活动上,腾讯AI Lab副主任、西雅图实验室负责人俞栋博士,介绍了腾讯AI Lab的研究方向和进展。

俞栋表示,人工智能最近几年飞速发展,在很多场景都提升了生产力,例如对话系统、自主决策、自主控制以及工业场景等等。

在腾讯内部,AI主要起到赋能作用。俞栋介绍说AI Lab主要关注四个方向:机器学习的基础理论、计算机视觉、语音识别、自然语言处理。在应用层面有三个重点方向:游戏AI、社交AI和内容AI。这些也都是跟腾讯业务比较契合的方向。

此外,腾讯在AI+医疗场景方面也有不少探索。

俞栋表示,腾讯已经把许多基本的AI技术和能力包装成API和SDK,包括语音识别、合成、翻译、情感识别、文本分析和理解、物体识别甚至闲聊等。这些能力通过两个渠道对外发布,一个是开放平台ai.qq.com,另一个是腾讯AI加速器。

在当天的活动上,腾讯众创空间也宣布第二期腾讯AI加速器开始招募,并且上线英文官网面向全球招募项目。

据介绍,腾讯众创空间将通过线下实体空间、线上创业服务平台、腾讯“双百计划”、青腾大学、腾讯全球合作伙伴大会等服务来扶持创业者。

以下是俞栋演讲的文字实录

今天,我要介绍的是腾讯的AI策略和已取得的一些进展。因为我的幻灯片用了英语,我将用中文演讲,以照顾在场大多数说中文的听众。

大家可能都知道,在最近的几年里,人工智能变成了一个非常热的词。一方面原因在于人工智能的技术得到了飞速的发展,另外一方面是因为我们看到在很多场景里人工智能确实能够提升我们的生产力。

比较常见的几个场景,一个是对话系统,比如说在CES里大家也能够看到有很多的智能音箱以及智能机器人和车,主打人跟机器或者人跟车交互这样的应用。

第二个比较常见的是人工智能技术在真实物理世界中的应用,这会涉及一些,比如说自主决策和自主控制这样一类的技术。

第三类是在已有的一些工业场景里面,之前因为缺少一些技术使得它不够智能化,有很多工作需要人工去做,但现在由于人工智能技术的发展,使得很多机械性的、重复性的工作,或者需要从大数据中发现复杂关系的工作,可以由机器来代替了。

人工智能技术在腾讯目前主要起到赋能的作用。它使得在很多场景里,体验能够做得比原来更好。所以在腾讯,我们的AI战略,叫做AI in All,就是在所有的场景里面,我们都想把人工智能技术用在里面。

从组织架构来讲,我们也建立了若干与人工智能相关的实验室;并且在很多不同的产品团队里面,有很多熟悉人工智能技术的工程师。在这些配置里面,其中一个很重要的组织就是腾讯的人工智能实验室,即腾讯AI Lab。我今天主要介绍在腾讯AI Lab的一些进展。

腾讯AI Lab有一个比较重要的目标,就是Make AI everywhere。其实也就是AI in All的另外一种讲法。

在研究层面,我们比较关注四个方向。一个是机器学习的基础理论,一个是计算机视觉,一个是语音识别,还有一个是自然语言处理。

在应用层面,我们有三个重点方向,就是游戏AI、社交AI、和内容AI。我们选择这三个重点方向主要因为它们和腾讯的业务比较契合。

游戏AI,主要是通过人工智能的技术,使得游戏的设计和玩家的体验都能得到提升。大家可能知道,腾讯游戏在整个世界范围都处于领先的地位,所以游戏AI有很多的应用场景。

第二个是社交AI,它的目标就是要通过使用AI技术来更好地提升人跟人,人跟机器的交互。这也是因为腾讯有两大主要的社交网络,一个是微信,一个是QQ。

另外一个就是内容AI,我们希望通过理解内容来更好理解用户,来给不同的用户提供不同的、个性化的服务。

在游戏AI领域,我们最早做的是棋类游戏,比如腾讯的绝艺,就是我们研发的围棋AI。在之前机器围棋国际性顶尖比赛UEC杯中,绝艺11连胜得到了冠军。

但是我们的游戏AI研究并没有止步在这里,因为我们觉得游戏AI不仅仅可以提升游戏的能力和玩家的体验,同时它也是一个非常好的研究人工智能技术的环境,是一个研究智能体怎么和环境、怎么和人交互和博弈的一个场景。

我们能够通过研究游戏AI,来慢慢地研究如何实现真正的,我们叫做通用人工智能的技术。所以在这方面,我们就不单单只是做围棋AI,我们同时也做智能体和人工环境交互情境下的一些游戏AI研究。

在社交AI领域,我们通过技术实现人跟人交互的更新的更有效的方法,以此提升人跟人交互的便利性和体验。

举个例子,就是通过技术手段,使得人跟人之间交互变得更容易。比如说有些人,他只懂某种语言,但我们可以通过语言之间的翻译,使得大家能够互相听懂。

在内容AI领域,我们不但要理解文本信息,也要理解图像和视频的信息。这样,我们一方面能够更好地理解内容本身,同时通过理解内容,也可以更好地理解用户,给用户提供更好的推荐。另外,我们也通过理解内容,反过来可以生成内容,这是更难的一步。

举两个例子。一个是,通过建立图像跟自然语言之间的联系,我们可以做很多事情。比如在照片下面我们可以自动加上标注,或者可以通过给定一张照片,找到其他类似的照片。另外,你也可以提供照片或者video(视频),让系统做其他事情。

另外一个例子,就是通过计算机视觉技术能够跟踪人的姿态变化。然后,产生一些更有趣的体验。

另一方面,通过内容AI,我们可以做个性化的推荐。这里是文本推荐,就是我们利用文本本身的信息,即新闻的信息、阅读人的信息和当时的环境,还包括他的朋友的信息,我们可以做到比较精准的推荐。

当然,在最近的几年里面,还有个很重要的人工智能应用场景,就是AI+医疗。

AI Lab也做了很多尝试,尤其是医疗影像和AI辅助诊疗上面,我们可以做到非常准确地识别食道癌和肺癌病灶。即便给定的训练样本只告诉系统有还是没有癌症,但没有标注在什么地方有,我们的技术也能自动地判断在什么位置有病变。这个比原有的技术有很大的提升。

另外,我们也在研究AI辅助诊疗,通过分析文本,包括分析医学论文和医疗记录,可以更好地了解某种疾病有些什么病症,发展下去有什么样的变化,在不同的treatment(疗法)下会有什么样的结果,然后半自动地构建一个知识库。利用这样的知识库,我们就可以做辅助诊断,不仅能够加快诊疗并且能让诊疗变得更准确。

我们把许多基本的人工智能技术和能力包装起来变成API和SDK,以便大家使用。这些能力包括语音识别、合成、翻译、情感识别、文本分析和理解、物体识别,也包括闲聊等,然后放在开放平台上。有两个渠道大家可以使用我们提供的能力,一个是AI.qq.com,另一个就是腾讯AI加速器。谢谢大家。

作者系网易新闻·网易号“各有态度”签约作者