2021年世界互联网大会,张亚勤参加企业家高峰论坛和数据与算法论坛两个论坛时,分享了自己对于绿色计算和生命科学的看法。
值得关注的是,绿色计算和生命科学都是其在离开百度后创建的清华大学智能产业研究院(Institute for AI Industry Research,Tsinghua University以下简称“AIR”)主要关注的两个研究方向。其中,绿色计算与“碳中和”息息相关,是目前经济发展中的重要话题;而生命科学则是生物学中的前沿方向之一,对癌症治疗等方面有着巨大的助益。
在接受记者采访时,张亚勤坦言,在AIR的工作显然离基础科研的距离更近,希望做可以真正被应用的科研。科研意味着巨大的成本投入,而前沿科技的创新则需要承担更大的风险成本。这些延伸出的问题是:如何平衡成本与收益?在冒着巨大的风险时是否能够成功获得相应的投资回报?
从张亚勤的角度来看,这些已经不再是他需要考虑的主要问题,因为他目前的主要工作是进行前沿科技研究,他对记者表示:“基础研究性的东西总要有人去做,去推动技术与产业的结合和落地。”
成立清华大学智能产业研究院 让AI成为AIR(空气)无处不在
2019 年10月,张亚勤宣布从百度退休,清华大学校长邱勇立刻向张亚勤抛去橄榄枝,两个月后,他加入清华大学。2020年12月1日,AIR正式启动。张亚勤作为发起人,成为AIR研究院院长。
在十分低调的启动仪式上,团队阵容也被揭晓,其中创始团队的核心科学家有张亚勤、赵峰、马维英和刘洋,都是各自领域的世界级科学家。
不知是不是巧合,清华大学智能产业研究院的英文缩写为AIR,其在英语中的释义为空气,与研究院要做的事情十分相像:AI技术研究和创新虽然经常被外界看不到,但却是支持场景应用发展的底层基础。就像空气,虽然看不到摸不着,但是却离不开它。
如今,AIR虽然成立还不到一年,团队规模已然得到扩充,据张亚勤透露,团队教授人数达到15人,学生人数达到100人。而张亚勤也开始习惯了新名片:清华大学教授、智能产业研究院院长。
对于AIR,张亚勤有着非常明晰的规划。张亚勤表示:“我们的战略很清晰:一是培养技术领军人才,特别是具备国际视野的 CTO 和具备系统思维的架构师。二是推动关键核心技术的突破。三是打造产业技术战略的智囊团。”
同时AIR以 ABCD,也就是人工智能(AI)、大数据(Big Data)、云计算 (Cloud)和装置(Device)为技术基础,锁定了智慧交通、工业 互联网和智慧医疗为起步阶段的三个研究方向。
而这三个方向都有一些共同点:一是都面对着巨大的商业空间和发展机遇。二是人工智能在探索过程中发挥着特别重要的作用,甚至是决定性、颠覆性的作用。三是相关研发成果实用化、普及化之后,将产生可观的社会效益。
近一年来,AIR一直沿着这条发展路径徐徐向前。虽然没有透露详细的技术成果,但张亚勤对于AIR目前的发展进度感到满意。“我们一直在做前沿科技领域的创新和研究,”张亚勤透露:“AIR已经在新药研发、车路协同等方面有一些阶段性成果。”
打破“天花板” 寻找AI的赋能空间
作为一种技术能力,人工智能还有多少赋能的空间?
在绿色计算方面,张亚勤认为 AI 赋能绿色计算大有可为:“我们需要沉淀出具备一系列可跨领域落地、可通用化的数据驱动算法应用,基于此搭建 AI 控制优化算法引擎,通过试点、合作、转化落地多领域的应用。”
具体来看,人工智能和物联网技术(AIoT)对碳中和会扮演重要的角色。通过智能感知可以融合多源多维的异构数据;利用人工智能,可以打造AI优化引擎对数据进行深度分析,实现数据驱动的智能决策;基于这些决策,可以全面优化产业链的资源配置。这种基于 AI+ IoT 的“感知-决策-优化”可以循环迭代,赋能产业绿色化,助力碳中和。
而在生命科学领域,随着基因测序技术、高通量生物实验、传感器等技术的发展,生命科学与生物医药领域正在步入数字化3.0时代,数字化、自动化进程加速。健康计算作为一种新型智能科学计算模式,是以人工智能和 数据驱动为核心的第四研究范式。
AI正在加速生命健康与生物医药领域向着更快速、更精准、更安全、更经济、更普惠的方向稳步发展。具体体现在,人工智能在蛋白质结构预测、CRISPR 基因编辑技术、抗体/TCR/个性化的疫苗研发、精准医疗、AI辅助药物设计等方面的研究已成为国际 前沿战略性研究热点。
因此,清华大学智能产业研究院在“AI+生命健康方向”做了四个研究方向的布局,聚焦在研究“AI 增 强个人健康管理与公共卫生”、“AI+医疗与生命科学”、“AI 辅助药物研 发”与“AI+基因分析与编辑”方向。
目前,在绿色计算方面,AIR和亚信一起,基于5G三维信道建模仿真,对多基站 MIMO 天线权值优化进行了研究。通过对环境状态及动作进行高效表征建模,和多智能体优化算法建模,双方实现了5G 网络功耗降低15%以上,5G网络覆盖质量提升5%以上的初步研究成果。
同时,张亚勤透露,由清华大学智能产业研究院(AIR)的兰艳艳教授带领 GeneBert 团队设计了一个新颖的基因预训练模型,通过构建序列与转录因子之间的二维矩阵,实现了一个多模态的基因预训练模型,获取了基因数据的有效表示,尤其是挖掘了非编码区的数据价值,在下游的启动子、转录子结合位点的预测,先天性巨结肠疾病的基因筛选任务上都大幅提高了性能。
让技术落地 脱离神秘感
技术不是空中楼阁,扎扎实实地落在应用场景中才能发挥最大的价值。此前,张亚勤在接受采访时便一再提到“技术落地”。为何如此强调“技术要落地”?张亚勤对记者表示,AIR汇聚了一批具有科研和产业背景的人才,希望致力于新的突破性技术落地,“哪怕这需要三到五年,甚至更长时间,但这类技术往往是面向未来、更迭时代的大技术。我们希望赋能产业,造福社会。”
落到具体的细节来看,人工智能需要大量的数据进行深度学习和训练,因此好的算法需要大量数据,但如果数据没有和产业合作,那么就没有真实数据,做出的研究也是没有根基、无法使用的。
从张亚勤的角度来看,目前AI应用数量庞大,也能提供相应的便利性。AI技术并非人们眼中带有神秘感的东西,其本质是大数据驱动下的模式识别。“现在主流的是深度学习、无监督学习、联邦学习等趋势,也已有很多落地场景应用了,比如人脸识别、语音识别、GPT-3等。我觉得,AI技术已经落地很多了,但是仍然有极大的发展空间。”
但如果从商业角度来看,如果希望AI成为一个好的商业模式,仍然需要不断投入人才、资金和技术,例如无人驾驶,可能还需要时间和资金的投入,但一旦实现,会给社会带来巨大变化,并且是积极的变化。张亚勤感叹:“这可能是AI最大的应用,也是最重要的应用。”
事实上,为了让AIR能够更加专注在技术研究上,张亚勤在研究院成立之初便设立的许多准则,比如控制团队成员规模,让团队小而精;不以学术论文作为业绩考核指标;同时提倡与企业联合研发的模式,让技术更懂行业,让行业更贴近技术,共享技术成果。
张亚勤希望 “技术能够走出去”,在研究院之外,在行业中把技术转化为产品,推向行业、产业,越做越大。
“AI技术已经落地很多了,但是还有极大的提升空间。社会需要投入资金、人才等进入AI 技术行业中。”张亚勤表示,AI能够解决很多问题,能够做是非判断,但并不是人脑的替代品,科研的目的也并非要创造比人更聪明的技术产物。
在企业合作方面,AIR一直在加强与企业在前沿技术场景落地方面的合作,张亚勤称,AIR就是要解决“明天、后天的大问题”。 例如,百度Apollo是AIR在交通领域非常重要的合作伙伴,双方成立了联合研究中心,并且共同发布了APOLLO-AIR计划。
“我们真正想做一些探索性、突破性的技术,希望对未来有更大的影响,解决更深层次的科学问题。当然,有企业也会和学校合作联合实验室,做产、学、研整个过程。我希望企业、高校、研究机构要投入时间和经历做各自擅长的事情。”张亚勤透露,AIR团队已经取得了一些阶段性成果,在AI新药研发方面、车路协同研究等方面进展的不错,“对于未来我非常有信心。”