清华姚班 清华姚班的科研能力 能孵化出一家怎样的公司
原创 关注前沿科技 量子位鱼和羊来自奥菲寺量子位 报道 | 公众号 QbitAI大学实验室的科研成果能孵化出什么样的商业价值?现在,清华大学的又一张王牌浮出水面——转化图灵奖得主姚期智院士和清华大学交叉信息学院徐葳副教授在隐私计算理论方面的研究成果,成立华控清交信息科技有限公司,还推出了实际可落地的商业产品。
转化图灵奖获得者姚期智院士、清华大学跨学科信息学院徐伟副教授在隐私计算理论领域的研究成果,公司成立了华清青教信息科技有限公司,也推出了实用的商业产品。
高盛前全球合伙人张旭东担任CEO,徐伟副教授担任首席科学家,还有很多来自姚班、清华的毕业生都是研发骨干。
没错,这家公司背靠的就是清华姚班人才力量,以及清华大学雄厚的学术资源。据说“清华一半的人才聚集在清华,一半的人才在姚班”。那么,在这样的学术背景下孵化出了什么样的公司呢?让数据「可用不可见」业内人士都知道,图灵奖获得者、清华大学交叉学科信息研究所所长姚期智院士的主要研究方向包括计算理论及其在密码学和量子计算中的应用。而华控清交正是抓住了「数据安全」这个点,基于姚期智院士和徐葳教授的科研成果,专注于研发和建设基于多方安全计算理论的数据融合技术、标准和基础设施。分析起来,原因其实很简单:数据安全正在影响数据流通,制约数字经济发展。在数字经济时代,数据可以说是关键生产要素。人工智能技术能够在寒冬过后再次复苏,引领时代技术潮流,得益于互联网带来的海量数据。不过,随着AI产品逐渐渗透到人们的生活当中,数据引发的隐私安全问题,也越来越受到大众的关注。从人脸识别到智能音箱,从推荐算法到视频通讯,无不挑动人们对隐私安全的敏感神经。从人脸识别到智能说话人,从推荐算法到视频通信,人们对隐私和安全都很敏感。
从隐私和安全的角度来看,数据作为生产要素,与一般生产要素相比,具有以下特点:
首先,数据的复制成本低,几乎可无限被复制;其次,数据使用不是排他性的,可以由多方同时使用;另外,数据可再生性强,在使用过程中会随时生产出新的数据。这些特征导致一旦未加密的明文数据被共享,就不再受控制,很可能被滥用。这也让各方不敢分享、不愿分享、无法分享数据。如此一来,数据生产要素化就受到了掣肘,「数据孤岛」现象在各行各业中普遍存在。那么,我们能否从技术的角度解决这个问题,让数据能够流通,价值最大化,同时防止信息泄露和数据滥用?答案是:可以。例如,20世纪80年代姚期智院士创立的多方安全计算理论,为实现数据的可用性和不可见性奠定了理论基础。所谓「可用不可见」,就是将数据分离成可见的具体信息部分和不可见的计算价值部分。这样一来,就在计算价值充分流通、共享的同时,规避了信息泄露的风险。具体来说,华控青教的隐私计算技术是基于多方安全计算密码学的理论安全优势,结合联邦学习、可信计算、差分隐私和数据脱敏等基于明文的数据隐私保护技术,以及区块链技术,将明文和密文相结合的系统。
并且,华控清交在工程上也已经实现了「数据可用不可见」和「规定数据具体用途用量」的实际落地,推出了自主研发的数据安全融合平台。数据交易和流通的基础设施根据官网信息,这一名为PrivPy多方安全计算平台的平台级产品已经实现了支持通用计算类型、高性能、集群化和可扩展的解决方案。PrivPy集成了多方安全计算、联合学习、私有查询等数据安全技术,并使用了秘密共享、混淆电路、可信计算等多种计算引擎。其高性能并行计算引擎,支持横向扩展和数据并行,以及TB级的数据处理。另外,该平台完全兼容ARM服务器,支持细粒度并行计算。此外,该平台与ARM服务器完全兼容,支持细粒度并行计算。
在开发方面,该平台支持Python和SQL操作,兼容NumPy和Pytorch等函数库,可以支持包括大部分机器学习算法在内的计算类型和系统实现,可以大大减少用户使用密文计算的学习曲线,实现多方安全计算产品的实用性和商业可用性。
同时,PrivPy自主灵活的模块化组合模式和多种部署方式能够满足用户在使用和部署中的多样化需求。在安全性方面,该平台具有以下特点:完备的数学/密码学证明安全假设清晰,易于实施和审计数据授权管理系统安全:SSL、CA认证等。核心密码协议设计简单而且开放兼容国际开源和中国商业秘密系统兼容区块链和可信计算的存证审计功能获得国内权威机构的安全认证华控清交的愿景,是为国家开发建设一套具有自主知识产权的、世界领先的、数据交易流通的基础设施,推动数据大规模的互连互通与融合利用,使数据真正成为社会化的生产要素,为我国全面进入数字经济时代铺设道路。现在,“吹”牛以产品的形式稳步落地,已经有实际应用案例。
应用案例在很多领域,比如政务、金融、医疗、安全、能源等。,对于AI技术在行业中的实际应用,开辟数据孤岛,实现联合建模而不留下数据具有重要意义。而从清华园中走出,华控清交的多方安全计算平台已经在这些行业中验证了能力。比如人脸识别支付保护数据隐私。人脸识别技术给金融行业带来了很多方便,比如刷脸支付,对大众而言已是习以为常的功能。然而,数据所有者作为极其重要的隐私数据,无论是保护用户隐私数据还是保护数据价值,都不愿意轻易分享。同时,人脸查询用户不愿意将客户的人脸信息提供给数据库运营商。华控清交多方安全计算平台,就能从技术层面解决人脸识别的隐私保护问题。通过多方计算平台,查询人脸信息时,查询方只会得到匹配结果,平台和数据源都无法知道查询意图和查询结果。
也就是说,这一过程中查询方和数据库运营方互相不暴露自己的信息,也就避免了人脸特征数据库信息泄露的风险,从而使人脸数据数据拥有方能够放心地将数据分享出来共同使用。以反欺诈为例。所谓道高一尺魔高一丈,随着市场和信息化手段的不断发展,不法分子也在利用先进技术,以更隐蔽的行为和方法实施金融诈骗。面对这样的挑战,如果能够安全有效地整合多个金融机构的相关数据进行人工智能分析和检测,通过提高大数据池中数据的质量和数量,可以提高反欺诈的准确性,建立更智能、更健全、更有效的风险控制体系。不过,金融机构的用户数据往往都有巨大的市场敏感度和潜在的商业价值。正因为如此,无论是从保护客户隐私和市场安全考虑,还是从保护自身利益的角度出发,各金融机构都不会轻易地分享这些数据。而华控青教的安全多方计算平台,可以让众多拥有私密数据的各方,在不直接提供原始数据的情况下,使用生成的密文进行有效的数据融合和计算,在保证数据隐私的前提下,完成大数据融合和人工智能操作。
具体而言,通过多方安全计算平台,多个金融机构可以将数据以密文的形式上传,之后在平台全密文环境下进行反欺诈模型的联合训练、预测,用更多样化的数据锻炼出更强大的AI,提升各自的反欺诈能力。产、教、研一体化今年以来,在疫情冲击之下,数字经济的新兴产业优势更加凸显出来,并成为构建经济发展新格局的重要支撑。数据作为人工智能应用的基础和数字经济的生产要素,在这种新的发展模式中起着关键作用。在这样的背景之下,如何在保障数据安全的前提下,促进数据的流通,实现无边界的数据融合,就成为了学术界、工业界共同面临的全新挑战。如今,以华控青教为代表的企业能够走出国内顶尖实验室,将前沿技术理论投入商业使用,无疑为打通充分发挥数据潜力的环注入了强有力的技术支撑。其商业化成果,也再一次印证了产学研融合带来的强大动能,探索出了AI赋能千行百业的一条新路径。那么,你如何看待产学研一体化?— 完 —本文为网易新闻网易特别内容激励计划签约账号【qubit】原创内容,未经账号授权,禁止随意转载。原标题:《清华姚班的科研能力,能孵化出一家怎样的公司?》