近几年,直播行业持续呈现爆发式增长,已经完成了从秀场、电竞向泛娱乐全行业的拓展,并呈现出深度融合教育、电商等多种生态的趋势。在这种趋势下,直播行业正迎来体验升级的时代,如何应对人们对实时性、稳定性日益增长的刚性需求,以及对更多创新玩法的渴望,是直播行业需要面对的新挑战。在6月9日的亚太内容分发大会暨第九届CDN峰会上,ZEGO即构科技合伙人兼CPO 颜延对即构科技的云通讯技术做了详细的分享。
01 音视频的动态发展,造就即构提供毫秒级延迟体验
众视Tech记者:您在本次大会演讲主题《如何在千万级并发规模下打造毫秒级延迟新体验》,能否剧透或补充下如何理解云通讯技术,目前音视频技术遇到哪些问题,即构科技能够解决哪些问题?
颜延:随着全球互联网和电信基础设施的快速发展,音视频通信的应用领域越来越广,体验效果越来越好。但一项最基本的技术挑战仍然持续,就是在复杂的网络状况下,追逐延迟更低、同步性更好的音视频互动传输。
我觉得音视频的发展一直是一个动态拉扯上升的过程,技术升级让最初以单向分发为主的直播,演进到大量实时互动的形态,而实时音视频技术又反哺直播场景,进一步完善了体验。同时,围绕着音视频又出现越来越多的互动形式,互动密度也大大提升。
比如说我们的低延迟直播产品(Low-Lantency Live,简称 L3),就是实时音视频技术反哺直播场景,进一步优化体验的一个成熟应用。我们团队通过软件定义多个基础云网络,自研编织了一张海量有序数据大网 MSDN(Massive Serial Data Network),通过 MSDN 与音视频技术结合,我们构建了支持千万级并发、强同步、毫秒延迟的低延迟直播产品。
另一方面,我们能看到更多产业也将音视频技术融入到他们的生产过程中,发生了相当多的化学反应,新产业带来新场景,新场景促成新升级。
目前对我们来说,怎样把技术与各行各业做到更紧密的结合是最大的挑战,也就是技术与场景的结合。此外,由于基础技术本身也在高速优化的道路上,关联性的技术发展比如深度学习、5G 等都带来了极大促进作用,所以技术与技术之间的结合又是另一个我们深耕的课题。
02 实时音视频产品快速迭代,即构让技术融于无形
众视Tech记者:目前 RTC 云通讯市场的现状是什么样的?客户对云通讯技术的需求在发生什么样的变化?
颜延:最初像 RTC 这个行业,我们是从互联网行业中的泛娱乐场景去接入的,因为泛娱乐本身在整个互联网领域里算是数字化程度较高的细分场景。因此,音视频技术可以快速去和用户的需求做结合。随着音视频技术的快速蔓延,客户的需求也从单一技术的“成本”和“性能”过渡到更加灵活、高效的场景解决方案上。
即构从创业至今一直秉持的理念是“让音视频技术融于无形”,我们实时音视频产品的迭代步履不停,同时又在云通信的不同层面上多点开花,推出了实时消息、低延迟直播产品、AI 视觉等产品,技术产品体系肉眼可见变得丰富立体,而融于“无形”的理念却在咱们每个人脑海里烙印更深了。因为不仅仅是技术和产品在往前跑,更多行业的生产流程、生产场景也在推陈出新,这样的变化并不意味着音视频技术要成为改造行业的主角,而是各种行业在更大的范围上包含了音视频技术。所以我们也选择用更结构化、层次化的产品矩阵去尝试多点融入,由此看到了一些化学反应。
我们所做的事就是,除了提供底层的音视频技术支持,为了满足更多企业快速获得音视频能力的需求,我们还将 PaaS 产品方案化,渗透进具体的业务场景中,提供低代码、可扩展、弹性伸缩的 aPaaS 模式解决方案,让客户可以更快、更低成本地实现音视频产品。
比如,在线教育领域在去年疫情的催化下,出现了大量的线下转线上的机构。为此,我们在今年2月推出了业内首个面向全行业的低代码互动平台产品 RoomKit,通过对业务场景能力的完整封装,实现了互动房间的 0 码搭建。就算是没有技术团队的客户,也能够通过 RoomKit 的功能可视化配置,完成产品的接入和上线。以在线教育为例,一个无需掌握音视频开发能力的开发者,15 分钟内即可搭建好一个功能完善的在线教学平台,大大降低了中小型机构的创新门槛。
03 更进一步提供服务,「低代码+音视频」快速搭建业务场景
众视Tech记者:即构科技解决方案覆盖到了在线教育、远程医疗、社交娱乐、互动电商、视频会议等等方面,那么如何理解即构科技「低代码+音视频」解决方案?即构科技为何会选择低代码作为云通讯技术的突破口?有没有典型案例可以分享?
颜延:像刚才提到的,我们在各行各业的业务结合和创造价值的过程中,发现我们需要更进一步做解决方案的优化。因为即构科技最初通过PaaS的形态提供产品服务的,这对于客户的要求和标准较高,因此,我们做低价码方案时,选择去做aPaaS形态的方案。
此外,aPaaS 不用像 SaaS 厂商那样重复组装车辆的过程,而是依靠行业套件为客户提供一辆辆成型的‘裸车’,用更接近于客户产品的组合方式,将技术利用起来。
因此在疫情期间,即构科技推出的小程序电商直播方案迎来了用户需求高峰。受疫情影响,线下商场、专卖店、连锁店的客户都希望可以通过电商直播来完成自救,但是这些商家往往对如何通过音视频SDK集成来搭建线上直播间没有基本的概念。
针对这一需求,即构科技将电商直播的核心功能封装成“音视频直播、商品列表、商品推送、IM 互动、后台管理”等多个模块,依托aPaaS模式为其提供服务。小程序电商直播的客户,只需提前与即构科技沟通场景需求,并提供一个小程序账号,即构在该小程序上进行技术部署,3-5天就能为客户搭建一个多个功能的小程序直播间。我们省掉了小程序的构建过程,省掉了如何上新、如何推送、如何让主播进行后续管理等运营前期的准备过程,让小程序电商直播的方案交付时间缩减了 90% 以上,客户拓展速度提升了12倍。
另外在泛娱乐领域,我们通过全面了解热门玩法,打造新的标准方案。比如线上 K 歌场景,我们是行业第一个落地真实时合唱场景的技术服务商,系统解决了以往线上K歌过程中,合唱者之间没办法实时对齐合唱的难题。我们克服了一系列技术难题后,把实时能力压缩到了真正实施的状态,而不是用其他串行的方式去实现。
04 发挥技术优势,为客户提供极致体验
众视Tech记者:音视频云服务能够让端到端的互动延迟缩短到毫秒间,那么即构科技是怎么样利用音视频云服务优势,为客户提供解决方案的?
颜延:即构科技的技术优势来源于自研的 RTC 引擎以及多云化技术架构,这一点我觉得可以分以下几点来讲:
首先是我们的自研引擎带来的技术优势。为了确保能最大化的实现为客户提供技术服务的目标,面对当时现有的主流开源引擎的应用局限,即构在创业初期,选择攻坚克难模式,走上了自研音视频引擎的道路。对此,我们将能力层优化到极致,不管是从架构、软件定义能力,还是算法作了补充。
其次,我们将多云化技术架构做到了极致。我们选择了全云化、真云化架构,深度融合顶级云商基础设施,通过把它变成可商业化的技术,实现其真正的价值,去服务社会、服务整个行业。
多云技术架构视频服务需要大量网络带宽和节点资源,而底层硬件、网络、系统的稳定性是整个平台稳定性的基础。即构音视频的核心服务构建在先进、成熟、稳定的云计算 IaaS 能力之上,拥有十多年大规模互联网服务的架构实践经验,在确保技术可控的前提下,把国际一流云商的技术积累和基础设施整合进即构的技术体系,相比自建基础设施的提供商,即构服务具有异常稳定的基础设施服务。
最后在服务方面,我们也在做大量工作,包括我们的服务团队一直秉持走到业务中去,跟客户一起成长的理念,形成与他们齐头并进的状态。为此,我们为客户提供一站式服务,包括针对业务场景输出博采众长的组合方案,为业务提供技术指导等。
总而言之,我们从基础的音视频能力上延伸,对产品矩阵不断完善,使更多的互动可能性抽象成一个个立体的产品形态,再加上持续的优质服务,让客户和开发者能完整地感知到我们的价值。