在11月20日的JDD-2018京东数字科技全球探索者大会上,京东数字科技副总裁、技术研发部总经理曹鹏发表了《不做“浮冰” 深挖数字科技与场景》的主题演讲,他明确表示,京东数字科技要做产业数字化合作伙伴,推动产业的互联网化、数字化和智能化。并表示,未来京东数字科技将做未来趋势的预见者,积极改变现实的推进者,与京东数字科技的合作伙伴一起在产业数字化的路上共建共生,共同实现数字经济的美好愿景。此外,曹鹏还分享了过去一年内,京东数字科技在数字科技领域取得的亮眼成绩。
以下为京东数字科技副总裁、技术研发部总经理曹鹏演讲原文:
各位来宾、各位朋友,大家上午好!
非常高兴能够在这里有机会跟大家分享一下我们做的一些事情。
大家也看到了,刚才陈总也公布了我们的品牌升级战略。现在,我又站在这儿,我们所聊的,我们所做的其实都是为了跟大家解释一个问题,一个最简单、最根本也最直接的问题,那就是京东数字科技到底要做什么。
在回答这个问题之前,我可以简单地说我们不做什么。
其实从我们成立的那一天开始,我们就定了一条原则,就是跟数据、跟技术无关的事儿,我们不做。对,我们做数据,我们做技术,但是我们又不光只做数据和技术,更多做的是把数据和技术放到场景里面、放到产业里面,我们要做的是产业的数字合作伙伴,我们要做的是推动产业的互联网化、产业的数字化和智能化。
回答完这个问题,我给大家汇报一下我们做的一些工作。
先来看一下架构。大家可以看到,我们实际上是在四个层次上面做事,最下面的是基础设施,也就是大家经常说的云这一层,这里面包括计算能力、存储、分布式的架构和虚拟化的技术、安防、容灾、监控等等一个系列,这一层很多的时候,大家是看不到的,但是我每次还是会说,为什么,因为这是所有上层建筑的基础,没有一个坚实的地基,上面的应用都会是空中楼阁。
在这之上,第二层就是应用的核心技术。所有的技术都围绕着三个领域在展开。第一个就是数据相关的一系列从数据的清洗、挖掘、计算、建模等等一系列的能力。数据技术是我们做产业数字化的一个最基础的根本和前提。
第二个就是人工智能技术。京东数字科技是国内最早大规模在业务上应用AI技术的公司之一,在这么多年的实践过程中,我们也积累了非常丰富的经验和具体的技术。从机器计算到深度计算,然后从计算机视觉到音频处理,到NLP,各种各样的技术都在各种场景里面发挥着它们的价值。
第三个是IOT,也就是物联网相关技术。我们在做越来越多的场景过程中发现一个问题,我们面对的其实是传感器,面对的是射频和加密的算法,我们需要能够感知周围环境的能力,我们需要有边缘计算的能力,我们需要把服务器上面的大数据和场景里面实时采集的信息进行融合、进行聚合和处理。所以,我们也着重地发展了这方面的物联网技术,我们也相信万物互联是所有产业数字化的一个未来的必然趋势。
在技术层之上就是场景。所有的技术都不是独立存在的,都是依托于场景的需求,在场景里面有营销、客服、风控,每一个场景背后都是一个或者多个技术的支撑。
在场景之上的最上层就是行业解决方案。现在有了技术、场景的功能,再加上我们对行业的理解,就可以包装出能够解决行业问题的解决方案。
看完这个架构,我来给大家汇报一下过去的一年里面,我们之前的一些技术的进展情况。
首先是一个比较基本的机器学习平台。案例过去一年,机器学习也有了一个比较大的改变。从早期大量依赖于建模人员的人工建模,逐渐的、更多的在使用自动机器学习的平台。
这就是一个例子,在这个里面我们最早的尝试是查找高净值客户,建模人员花了很长时间根据模型寻找客户,但是非常不幸,样本量太小,样本很稀疏,而且这些客户的信息没有办法集聚,所以大家可以看到下面的蓝色和绿色的线是我们尝试的人工建模模型,效果不是很好,然后就用了自动机器学习平台。自动机器学习平台里面非常关键的一点是它沉淀了从海量数据中寻找出来的用户特征知识图谱,这就使得原来很多很难解决的问题,比如样本稀疏,用户的特征很难聚集这样的课题都能够很好的解决。原来建模人员用了几周时间建模也解决不了的问题,在这个平台上跑了一天所得出的模型,它的AP直接从0.22提升到了0.8,效果非常理想。
所以,这个平台不管是从效率上面、从效果上面还是从成本上面都有着很大的价值。所以越来越多原来做不了的事儿、细分的场景都可以非常低成本地实现,机器学习能够支撑更多的业务。
第二个,这个东西去年JDD上也发布过,生物探针技术。这个技术在过去一年里面,它的核心指标也得到了很大的提升,现在它不光支持了京东集团里面安防、核身和风控等等一系列功能,也成功向外输出了从国内小的银行到大的头部银行一系列的项目,帮助他们实现数据化和科技化。
刚才李院士谈到的养猪的项目,去年还是一个简单的猪脸识别的赛题,现在已经发展到了整个行业的解决方案。
数字风控系统,这个课题每年都会谈到,基于数字的风控模型一直是我们最早、最古老也是最核心的技术,应该是在2014年11月份最早在白条的授信模型里面使用了人工智能技术。从那一天开始,风控模型经过了十个版本的迭代,到今天风控模型里面有超过90万维的特征,然后有超过150个子模型支撑着整个风控系统。这个风控系统涵盖了从贷前的预测,贷中的监控到贷后的催收整个产业链,一个用户从他来的时候开始,从注册到交易到支付,整个场景里面背后都有风控系统的影子。
得益于人工智能技术的应用,我们更多的可以从弱相关联的数据当中发现更多的价值,这就使我们的系统能够支撑更大范围的应用,能够匹配更多的用户达到更好的效果。
现在我们已经完成了对超过5亿的互联网用户的风险评估,同期我们的风险降低了50%。在座有很多金融行业的同仁,大家应该可以知道白条和金条的资产不良率在行业里面都处于一个非常低的水平。
汇报完去年的一些传统工作进展,我给大家汇报一下我们做的一点新的尝试。
我们现在正在研究的一个很复合的技术,这个里面有心理学专家的心理学模型,有计算机视觉的特征抽取,有基于声波和声闻的分析,有语义的合成、语音的理解,所以这种复合技术的应用,让我们可以做更多原来我们做不了的事儿,可以观察一些原来看不到的东西,所以这种技术我相信不管是在风控里面,在安防里面,甚至在HR的员工情绪管理里面都可能有它的价值。
说说安防,安防也是技术应用一个很重要的场景。我们的安防体系包括人脸的轧机,刚才大家进来的时候应该也看到了,包括人脸的门禁,包括人员的密度检测,基于用户ID的用户行为跟踪,包括用户访客系统,除了支撑京东集团内部的物业以外,还成果地向外部很多智能机构进行输出。
这是一个机器人,最早是为了解决运维自动化提出的一个项目。发展到第二代的时候,它除了能够做机房的常规巡检,能够检测机房的环境,能够识别所有机器的故障码,能够对机房里面的检查人员进行跟踪监控,还可以跟固定资产系统打通,实现自动化的物资盘点,一系列功能,非常高兴,在第二代的时候,除了解决我们自己内部的问题,还对外提供输出。很多机构都跑过来说,能不能用一下你们的机器人,我们想试一下,看看这个机器人能不能解决运维问题,解放运维成员,降低成本。
所以,整个系列从最早只有一款机房巡检产品,慢慢也发展到了包括信用机器人、金库的智能搬运、铁道的巡检、可穿戴设备等等一个完整的系列。
说完一些具体的场景跟功能点,下面我想介绍一下过去的一年在做的一些对行业的理解。其实我想说的是,做技术这么多年发现,光有技术是不够的,光有场景和功能也是不够的。我今天的主题叫不做浮冰。为什么呢?
因为我们真的深刻地理解到想要干成一件事,必须得扎到一个行业里面去,去学习这个行业的知识,感受这个行业的痛苦,然后才有可能做出一个解决行业痛点的解决方案。
比如金融行业,我们进入得最早,最早也在谈信贷和风控能力,大家也知道得很清楚。今天也介绍一下资管。
刚才陈总也介绍了,我们做资管也做了一些年,做资管的过程中我们也做得很痛苦,遇到很多问题,包括专业人员的能力、信息披露得不充分,计算能够弱、风控能力不够等等。
但是做了这么多年以后,我们尝试着把这些痛点逐一解决掉,提出一种新的基于基本面和量化相结合的投资模式。这种模式相对于原来的投资方式来讲,它更全面、更精准也更智能,因为这种模式在初期最早测试过程中,首批合作伙伴就涵盖了国内的顶部银行到券商超过20家机构,它所管理的资产超过6万亿。
再来说营销。刚才陈总也说了我们新的营销解决方案。这个新的解决方案很大的重点放在了线下,为什么放在线下?是因为在这个行业里面我们扎进来做了。
大家记得去年在发布的时候,我们在谈做营销来客系统,核心是数据驱动的精准投放,所有的数据和技术公司基本都会把这个当成一个核心能力。真的扎到这个产业里面来做,做了一年,现在你跟我说这个东西好不好,我说特别好,你看我们的客户,他们用我们的系统,他们的获客成本都有非常大幅度的降低,最多的一个降了超过80%。80%,看起来特别美好的一个数字。但是真的要说这个东西够不够,我特别实诚地就告诉你说,这个可能还不够。为什么,80%很夸张,但是实际情况什么样子,一个没有知名度的小贷公司,它做盲投,一个获客成本可能超过5000块钱人民币,通过数据的精准投放,可以降到900块,降低80%,但是不管5000块也好900块也好,这个数字都是它承受不了的,成本太高了,为什么?因为有线上的用户量,再加上现在线下所做的实时竞价的模式,把优势流量的成本推高到非常畸形的高度,这些你不进到产业里面是不知道的,所以我们除了做数据的精准投放以外,我们把帮助客户获得更优质更低价的流量做成我们的一个核心目标。
更优质的流量在哪,有可能是在京东的自有流量里,有可能是在新的有流量红利的媒体里面,比如像新的短视频媒体、比如像裂变的传播这些领域,更多的可能是在线下。因为从2016年开始,线上的获客成本就超过了线下,在线下我们有机会获得一个更精准、真实、也更低成本的流量,所以我们正式提出了双百计划,百亿京东的线上流量加百万线下的支撑屏幕,我们要做的就是用O2O的模式打通线上和线下的数字营销。
智能城市,刚才郑宇博士也介绍过了,院士也介绍过了。在这个领域,郑博士沉浸超过了12年,他对这个领域里面的痛点有特别深刻的理解,所以他才有机会提出一套从点到线到面的顶层架构。再结合京东数字科技的数字能力和技术,所以才能够在非常短的时间内提出了六大解决方案,覆盖了超过30个城市。
最后介绍一下养猪的项目。说实在的,在最开始接触这个项目的时候,我们还是很纠结的,也很犹豫的。为什么呢?因为我们最开始想做的就是一个简单的猪脸识别模型,其实对这个行业并没有什么特别多的了解。
我们的员工拿着猪脸识别模型到猪场去,被人家嘲笑得无地自容,根本就没有用。但是我们又特别幸运,为什么呢?因为这个行业虽然在嘲笑我们的无知,但是同时它也告诉我们,他们自己非常真切地认识到这个行业里面的问题,他们也特别渴望用技术改变这个行业。所以,我们才有机会能够把自己洗白,重新扎下去,从头开始学习。
我们有机会跟集团的领导学习他们的管理理念,有机会下到猪场里面,跟猪场的场长和技术员学习他们的饲喂经验,我们发现很多饲喂经验之间有冲突有矛盾。特别幸运的,我们又能找到很多行业专家,向他们请教真正科学的养殖办法。
一直到有一天,我们的算法和我们的研发工程师在猪场里面一待就是半个月,每天扛饲料,每天铲猪粪,赶着肥猪称重,赶着母猪配种,直到这个时候我们才说好象可以干这件事了,我们好象已经摸到这个行业的门槛了。
直到我们真正杀到一线去,我们体会到这个行业里面特别真实的一个痛点。所以现在的解决方案不是一个特别单薄的猪脸识别功能,它已经变成一个特别整体的项目,它最核心的是一个神农大脑,这里集成了国内顶尖的养殖专家的养殖经验,还有AI算法可以做到非常精准的饲喂甚至到每一个个体,它传出的指令会到两个地方,一个是SaaS系统,直接到管理员。SaaS系统里面内置了超过60个环节的100多个模型,都是养猪过程中所必需的任务,这个可以实现整个养殖过程中的标准化。
另外一条线就到IOT设备,我们自己研发了一系列的IOT设备,从整个环路的监控到巡检到饲喂等等。在这些设备里面,我们用了最先进的人工智能的技术。然后我们的成本是国外同类设备的十分之一甚至更低。
这些设备可以自动化实现一系列的环境调整到饲喂,这样我们也可以实现养殖的自动化。大家可以看到,现在整个方案已经在一些实验的猪舍里面完整地跑通了,经过测算,有特别大的经济价值。推广到这个行业,对中国社会的价值也是巨大的。
最后我想说的是,我们要干的其实就是这些事儿,京东数字科技手里有什么,手里有技术,有对用户的理解,再加上我们不断地尝试,对行业进行洞察,这样我们可以布局很多的行业,我们的客户也遍布了从C端的客户到B端,到政府,实现三端打通。我们的slogan叫预见、改变、实现,我们希望能够做未来趋势的预见者,也希望能够做积极改变现实的推动者,我们希望能够跟我们的数字化的产业合作伙伴一起在产业数字化的路上共建共生,共同实现我们的美好愿景。
我的讲话完了,谢谢大家!
关于JDD-2018京东数字科技全球探索者大会
JDD-2018京东数字科技全球探索者大会于11月20日在北京中国国际展览中心新馆举办,总奖金达220万元的同名大赛于同天上午正式启动。本届大会由京东集团、京东数字科技联合主办,KDD China为学术指导单位,APEC中国工商理事会青年企业家委员会为支持单位。大会旨在连接科技界、产业界、金融界、学术界、投资界五大圈层,搭建一个全球化的开放平台,共同探索数字科技创新之道,实体经济数字化升级之路。
相比去年的首届大会,本届JDD大会规模再创新高,共有来自政府部门、金融机构、投资机构、大型企业和科研院所的近3000名嘉宾,包括400名业界大咖出席了大会。京东数字科技CEO陈生强、京东集团首席技术官张晨与30余位重量级嘉宾在大会上畅谈未来数字科技发展趋势,其中包括中国工程院院士、原中国工程院常务副院长潘云鹤,中国工程院院士、中国农业大学动物科技学院教授李德发,麻省理工学院教授、生命未来研究所主席、畅销书《Life 3.0》作者Max Tegmark,美国国家工程院院士、MIT人工智能实验室主任Daniela Rus,日本机器人“教父”、ROBOGARAGE公司创始人兼CEO高桥智隆,知名科幻作家、雨果奖获得者、“童行学院”创始人郝景芳等国际知名学者和业界领军人物。