郑纬民在第四届海丝中央法务区论坛分议题四上的主旨演讲
中国工程院院士、清华大学教授郑纬民
在第四届海丝中央法务区论坛分议题四上的主旨演讲
近几年,人工智能技术有两项显著的突破。首先是基础大模型进入了多模态阶段——不仅可以处理文字,还可以处理图像、视频等不同形式的数据。其次是大模型逐步进入应用阶段,越来越多的大模型开始结合各个行业,比如金融、医疗、智能制造、气象等领域,帮助提升行业效率和智能化水平。
在整个大模型的构建过程中,算力是最核心的资源,尤其是依赖于高性能的GPU系统。目前主流的训练系统仍然依赖于英伟达的GPU,尽管其硬件性能强大且编程生态成熟,但由于国际形势的限制,获取这些资源变得愈加困难。这也加速了国内AI算力的本地化发展。国家计划到2025年实现国产算力占比50%,到2030年几乎完全国产化。目前,北京、上海、江苏等地已经开始推动国产算力的应用。
然而,国产算力面临的主要挑战是软件生态的建设。虽然我们在硬件上取得了一定进展,但与英伟达等国外系统相比,国产系统的软件生态还不够完善,移植难度大,用户体验较差。因此,提升国产智能算力平台的软硬件生态至关重要。
为了解决这个问题,清华大学开发了一个叫作“八卦炉”的核心基础软件系统,专门为国产芯片和大模型训练优化。通过这个系统,训练成本可以大幅降低。在青岛的超级计算机上,我们利用八卦炉系统进行大模型训练,成本只有英伟达系统的六分之一,性能却接近甚至超过国外系统。
我们已经在多个国产平台上成功应用了八卦炉系统,包括沐曦、摩尔芯片等国内厂商。测试表明,使用八卦炉后,训练效率提升了30%,意味着可以减少30%的硬件投入。这不仅节省了成本,还提高了模型训练的整体效率。此外,在推理阶段,通过优化存储和算力调度,八卦炉也显著提升了推理性能,使存储资源得到更高效的利用。
在数字政法领域,人工智能大有可为。政法系统是一个典型的需要处理大量数据的领域,过去几十年积累了海量的案件数据。这些数据不仅丰富,还包含了许多标注和注释,非常适合用来训练大模型。通过大模型的辅助,司法机关处理案件的效率可以大幅提升。