刘奕群在第四届海丝中央法务区论坛分议题四上的主题演讲
清华大学科研院院长、互联网司法研究院院长刘奕群
在第四届海丝中央法务区论坛分议题四上的主题演讲
过去几十年来,人工智能技术的发展经历了“三起三落”的过程。从早期的专家系统到现在的大模型,社会对人工智能的期望不断变化。当人工智能技术在某些节点上取得突破,比如AlphaGo和ChatGPT,社会的期望迅速飙升,甚至超出技术供给能力,造成失望和低谷。因此,在司法领域应用大模型时,我们需要建立合理的预期,既不能高估它的能力,也不能低估它的潜力。
司法领域具备应用人工智能的天然优势。2018年左右,我们在最高法的领导下,开始探索如何将人工智能应用于司法。司法领域有丰富的公开数据,这为大模型的训练提供了良好的基础。同时,司法机关迫切需要提高效率,人工智能的应用可以帮助他们提质增效。我们认为大模型在司法的全流程中都有广泛的应用场景,包括诉前调解、立案、审理、文书撰写等各个环节。
但我们发现,单靠通用大模型并不能解决司法领域的所有问题。法官在审判中不仅是法律专家,还要承担社会责任,维护公平正义。因此,司法大模型必须结合通用大模型的常识推理能力与法律领域的专业知识。通用大模型可以解决常识性问题,如要素提取和信息抽取,而司法大模型则可以提供专业的法律判断。
为了构建司法大模型,我们通过注入法律法规、司法文书、教材和专家论文等数据,训练出法律基础模型。然后,我们使用少量标注数据对其进行后续训练,使模型能够处理特定的司法任务。这种方法与传统的监督学习不同,大部分过程是无监督的,标注数据的需求很少,但效果显著。
我们还通过大模型对一审案件的改判和发回进行预警。通过对潜在问题的提示,帮助法官避免错误判决,从而降低改判和发回率。
司法领域是一个多方参与的过程,庭审中涉及法官、辩护人、公诉人、当事人等多方角色。我们正在研究如何通过多智能体交互模拟司法庭审甚至立法过程,用计算手段帮助解决司法中的复杂问题。通过多次模拟庭审,我们可以提前预测立法可能带来的后果,为法学研究提供新的工具。