9月29日,Intel Innovation 2022在美国加州圣何塞落下帷幕,作为 Intel 专注于未来创新的年度开发者会议,Intel CEO出席并做主题演讲。本次大会聚焦在 AI、5G、云计算等最新技术,会议集中展示了最前沿的科研成果,致力于与合作伙伴共建强大的生态圈。
在本次会议中,来自字节跳动安全研究团队的Jeddak数据安全沙箱亮相,向观众展示了如何在保护数据隐私不泄露的情况下进行多方数据的联合计算和分析,实现数据“可用不可见”。本次在Intel Innovation峰会是Jeddak隐私计算沙箱产品的首次对外公开。
数据的碎片化、孤岛化与海量多维数据共享的需求越发矛盾,充分发挥数据价值的同时又需要确保用户隐私安全,Jeddak数据安全沙箱能够为多源数据融合计算提供高安全、高可用、高性能的解决方案,在公有云、私有云以及混合云计算场景下,全方位地为用户保障数字化资产安全。
Jeddak数据安全沙箱
Jeddak数据安全沙箱是一个聚焦于可信执行环境(TEE)技术所构建的数据计算平台,适用于跨参与方数据隐私计算的应用场景——既能够满足使用方联合多源数据进行计算的需求,打通“数据孤岛”;又能够达到数据“可用不可见”的安全合规要求,保障对于数据计算过程的隐私、安全、可追溯和可扩展,为数据的可信互联互通提供行之有效的解决方案。
沙箱为用户提供安全的数据处理、联合分析、联合建模等服务,支持隐私集合求交、匿踪查询、机密SQL查询、隐私保护下的TensorFlow/PyTorch建模及预测等功能。通过:
(1)一站式的管理控制台
(2)安全执行引擎
(3)可信容器集群
(4)可信硬件的部署和实现
确保用户能够高效便捷完成计算任务,并保证数据机密性、完整性、以及处理逻辑的可验证性,在云端代理计算、数据合规计算、分布式计算等多类应用场景下,为用户创造更多价值。
强强联合下的隐私计算能力
Jeddak数据安全沙箱结合Intel开源的BigDL Privacy Preserving Machine Learning (PPML)解决方案,为用户提供安全、高效的数据处理及分析功能,实现在原始数据明文不暴露的前提下获取多方数据的联合统计、查询结果,满足不同机构数据分析人员针对敏感或强监管数据进行的多方联合数据查询的诉求,解决诸如在广告投放领域中的投放效果分析、归因、对账等痛点问题。
系统在安全性方面采用加密技术保证了数据传输过程中的安全性,并采用KMS方案保证密钥在存储交换过程中的安全。在大数据处理过程中,采用Intel Attestation Service方案保证了分布式节点的可靠性和安全性。同时,Jeddak数据安全沙箱联合分析系统采用云原生技术Kubernetes及大数据分析技术Spark/Hadoop,满足海量数据的处理要求并保证了计算过程的稳定性和高性能。此外,系统还与区块链平台进行融合,任务计算过程中的关键信息都会上链存证。
在业务层面,Jeddak数据安全沙箱联合分析系统以标准 SQL 为输入,支持对数据的使用进行授权;支持数据的动态加载和更新;支持对目标 SQL 进行多方安全审核;并提供区块链浏览器,对任务过程中的上链信息进行查询和审核。系统的部分任务操作界面如下图所示:
在执行效率上,Jeddak数据安全沙箱联合分析系统可以在分钟级别完成亿级规模数据的联合分析,高效满足大部分用户的隐私计算需求。
更多应用与实践
在联合营销、政府疫情防控、生信大数据分析等场景下,Jeddak数据安全沙箱也正在助力企业安全合规地使用数据、挖掘多方数据价值。
通过自研的JeddakTEE开发框架,在开发角度,沙箱兼容LibOS、WASM在内的多种安全运行时,并适配多种异构底层TEE硬件平台,用户可一键编译部署运行业务代码,大大降低用户开发部署TEE应用的门槛。
面向多元场景,沙箱构建了通用的计算引擎和算法仓库,支持包括TensorFlow/PyTorch脚本在内的训练和预测任务,并且具备基于联盟链的状态存证与验证能力。沙箱融合加速引擎通过自研软硬件一体化的执行算法,显著提升MPC、FL等隐私计算过程的执行速度和通信效率——隐私计算求交算法相较于目前最快的MPC协议提升超12倍,纵向联邦算法相较于纯软件方案,提升近40倍。
总结与展望
随着逐渐完善的法律法规和日益增强的监管环境下,对于有数据使用和数据流转的企业和组织来说,保护数据安全已经提升到了空前的高度,保护数据安全已成为企业的必选项。Jeddak数据安全沙箱团队也将继续携手生态合作伙伴,共同探索隐私计算中的更多实际应用场景,致力打破“数据孤岛”,在合规下发挥数据的最大价值。