深度学习在智慧司法中的应用研究
1前言
随着人工智能与机器学习的发展,各个领域均掀起信息化改革的浪潮,司法信息化是当前司法改革最重要举措之一,而智慧司法是司法信息化改革的核心部分。随着全国各地智慧司法的建设,手写汉字识别、语音识别、司法聊天机器人,司法文书语义分析等典型的技术问题逐渐浮现出来,且成为智慧司法建设进程中亟待解决的问题。
深度学习作为当今机器学习领域乃至计算机和互联网领域最为炙手可热的研究方向之一,自面世以来其预测的准确度就在很多方面大大超越了以前的机器学习算法,在图像处理、自然语言.音频识别等方面展现出了惊人的优势。尤其是近几年来卷积神经网络(CNN)、循环神经网络(RNN)、对抗神经网络(GAN)的出现更使得深度学习算法一路高歌猛进,得到了学术界和工业界的广泛关注。
通过深度学习和海量数据的结合将会在不同领域取得令人瞩目的成绩。本文立足于司法角度,介绍了如何运用深度学习模型解决智慧司法建设过程中典型的技术难题,从而推动司法信息化的发展。
2深度学习的发展及定义
2.1深度学习的发展
深度学习作为机器学习的一个分支,早在1943年W.Pitts等人就已经提出了最早的神经网络模型,并用数学方式对其进行建模。但是直到1980年之前,神经网络都没有很大发展,只能进行浅层的线性二分类,甚至无法计算异或操作。1980年,深度学习的创始人G.Hinton提出了多层感知器模型,使用多维度的隐含层来作为传统的单层感知器的替代品,从而有了一定的突破。
但机器学习在几十年的发展中,仍有很多问题未能解决。其中包括:BP算法随着神经网络层次的加深,参数优化效果无法传递到前层,从而导致容易出现局部最优解或过拟合问题叫,以及计算机尚未发展成熟,所以直到21世纪初,出现过几次神经网络热潮都很快因为其物理局限性而被迫进入冰封期。而同时代机器学习又出现了很多有效的其他算法,例如决策树、贝叶斯网络、支持向量机等很多衍生算法。可以说,以前的深度学习被给予厚望,但是只停留在人们的概念之中,直到2006年Geoffrey Hinton在著名的科学杂志上发表文章,提出了一种新的神经网络,也就是我们现最热门的“深度学习”的雏形。
笔者在对dblp数据库中对deep learning关键字进行检索后发现,深度学习相关论文在1998年到2009年间逐年小幅度增长,在10篇周围浮动,尚属于一个研究的小众领域。从2010年到2017年深度学习相关论文开始呈现几何级数增长,到2017年各类期刊杂志上的论文数量已经增长至3008篇,足以见得深度学习在研究界的火热程度。
2.2深度学习的定义
深度学习因为涉及例如信息识别等很多相关领域,所以很难从广义上界定。相关的定义很多,这里我们采用一个比较权威的定义:
机器学习是专门研究计算机如何实现或模仿人类的学习行为,获得新技能和新知识,并且识别现有的知识,从而利用经验使自身性能不断改善提升的一门科学。P深度学习是机器学习的子领域,是试图通过一系列多层的非线性的变换对数据进行抽象的算法。[例
用一个神经网络举例:
如图1所示,图中的每一个节点被称作一个神经元,通常我们也将它称为一个感知器,每一个感知器都有一个或多个输人和输出以及其自身的权重。图中最左边我们称作输人层,输入后面的一排感知器我们称作第一层感知器,后面的也以此类推,总体称作隐藏层,最后输出的单元被称为输出层。第一层感知器每一个感知器都接受了输入的值并输出了四个结果,隐藏层第二层感知器接受了来自上一层的所有结果并将其作为自己的输人值,通过权重做出自己的输出,通过这种方式,使得每后一层都能做出比前一层更加复杂和抽象的决策,直到最后一层输出结果。
传统的机器学习算法在很大程度上依赖的是人为的建模和特征提取的函数,通过人赋予的函数来保证计算数据和预测的精确度。与传统机器学习方法不同的是,深度学习试图自动完成数据表示和特征提取工作;并且深度学习更强调,通过学习过程提取出不同水平、不同维度的有效表示,以便提高不同抽象层次上对数据的解释能力。深度学习中的深度是用于将所有参数切割到不同参数空间,通过一系列的前向和反向传播函数,从前一层或后一层获取数据,逐层对其参数进行修改。而其存在的意义在于自动学习相关数据之间的内部关系,主要的方法是寻找数据的“特征”,简单地来说,就是能够在处理数据的同时,通过改变自己内部参数的方式获得更好的数据处理能力。
文章来源:《CT理论与应用研究》 网址: http://www.ctllyyyyj.cn/zonghexinwen/2021/0418/929.html