第二届大会回顾第8期 | 智能终端OS的个人数据处理与保护

OpenHarmony TSC 2024-02-21 424

描述

演讲嘉宾 | 夏虞斌

回顾整理 | 廖涛

排版校对 | 李萍萍

大模型

嘉宾介绍

OS安全分论坛

夏虞斌，上海交通大学教授/博导、上海交通大学OpenHarmony技术俱乐部主任、中国计算机学会CCF杰出会员。主要研究领域是操作系统与系统结构，研究兴趣为通过软硬协同设计增强计算机系统的安全性、隔离性与性能。与团队开发的系统包括：RISC-V平台的可信执行环境系统“蓬莱”，直通式进程间调用硬件扩展XPC，启动时间小于1ms的Serverless系统Catalyzer，开源的Serverless性能测试集ServerlessBench，去中心化可信搜索系统DeSearch等。

视频回顾

打开哔哩哔哩APP，观看更清晰视频+详细报告内容

正文内容

在当今万物互联的时代发展背景之下，智能化和物联网等技术快速发展，为智能终端产业带来了更加广阔的市场空间。人们日常生活中接触到的智能终端产品类型越来越多，功能越来越丰富，个人数据的泄露风险也随之上升。如何从操作系统层面保障智能终端的用户个人数据安全？上海交通大学教授、OpenHarmony技术俱乐部主任，教育部青年长江学者夏虞斌在第二届OpenHarmony技术大会上进行了精彩分享，提出了端侧大模型+端侧机密计算的技术方案。

大模型

智能终端上产生的个人数据涵盖了多个维度，包括聊天、通话、购物、浏览等虚拟世界的数据，以及位置、出行、运动、体温等现实世界的数据等。手机作为用户日常使用最频繁的智能终端设备之一，是个人连接数字世界最重要的入口。在手机上，每日需要存储、处理和流转海量的个人数据。

目前，终端个人数据处理主要存在以下三个挑战：

一、数据异质性：包括应用数据类型的异质性和访问数据接口的异质性，如何实现跨应用、跨OS、跨设备的统一数据表达？

二、需求多样性：包括用户需求内容的多样性和用户需求表述的多样性，如何实现用同一段代码满足用户的多样需求？

三、隐私敏感性：包括数据存储的隐私敏感性和数据处理的隐私敏感性，如何在终端侧保护个人数据存储和处理的隐私性？

大模型

针对数据异质性挑战，采用直接在系统底层截获并存留用户可见的终态数据的新方式是一个可行途径。传统的数据处理方式主要基于初态数据，如数据库、文件等。这些初态数据的数据量小，内容准确，但格式种类繁多，部分数据还可能加密。终态数据即用户直接感知的数据形式，如图片、声音等。相比于初态数据，终态数据具有数据形式单一的优点，更有利于实现跨应用、跨OS、跨设备的统一数据表达。

大模型

针对需求多样性挑战，可基于大语言模型满足用户的多样性需求。理想情况下，可基于第一性原理，让模型直接感知用户所感知的数据，并由模型直接对终态数据进行处理，进而理解内容最终实现与用户交互，类似GPT-4V。目前，该方案还存在以下几方面限制：（1）能力限制：对于图像数据的处理能力依然弱于对文本的处理；（2）成本限制：终态数据量过大导致调用次数急剧上升，成本无法接受；（3）性能限制：单帧数据的处理时间以秒计算（如GPT4），时延无法接受；（4）安全限制：手机保存了用户最为隐私的数据，安全性不容丝毫闪失。此外，大语言模型的安全问题也应该得到重视。

大模型

针对隐私敏感性挑战，可基于机密计算技术在终端侧保护个人数据存储和处理的隐私性。机密计算是一种在计算机处理器的保护区内处理数据的方式。早期，机密计算在云侧应用较多，如Microsoft Azure、Amazon和Google Cloud等云厂商均推出了基于机密计算的产品或解决方案。目前，在端侧部署机密计算方案也逐渐受到业内关注，如2021年推出了面向ARM平台的机密计算体系结构（CCA），支持内存加密和机密虚拟机抽象；2021年推出了面向RISC-V平台的可信执行环境“蓬莱”，同样支持内存加密和机密虚拟机抽象。目前，机密计算已经成为云计算的重要发展方向，而端侧机密计算会快速发展。为了解决当前算力不足问题，可以采用基于OpenHarmony分布式机密软总线的端+云的协同机密计算方案。

大模型

为了解决在端/云侧部署机密计算或可信执行环境（TEE）的相关难题，上海交通大学团队提出了ARM的机密虚拟机平台TwinVisor；微内核安全操作系统ChCore；可信执行环境软硬件平台"蓬莱"；分布式可信执行环境端+云的机密计算方案等学术成果，进一步保障了用户个人数据在智能终端设备上存储和处理的隐私性和安全性。

大模型

未来，基于大语言模型构建个人数字助理将极大提高生产率。个人数字助理能够让个人拥有字面意义上的“过目不忘”能力，在用户需要的时候进行查询和反馈；除查询功能外，数字助理还可替用户主动完成相关操作。此外，面向未来的个人数据底层基础设施也会逐步完善，如支持多种大语言模型的插件式架构、端云协同构建系统安全能力以及端侧硬件算力提升以支持端侧大模型等。

通过端侧操作系统架构设计和软硬件协同，并结合大语言模型的强大能力，能够在保障用户隐私和数据安全的前提下，进一步提升智能终端设备对用户个人数据的处理效率。

「嘉宾材料暂不分享」

E N D

关注我们，获取更多精彩。

审核编辑黄宇

打开APP阅读更多精彩内容