Local EPUB Text
知之为知之,不知为不知
先简单介绍一下最大熵原理(Principle of Maximum Entropy)。它产生于信息论和热力学,和概率统计学相通,近年来被应用于计算机自然语言处理,非常有效。有人认为前面提过的贝叶斯法则等都是最大熵原理的特例。
熵指的是系统的混乱程度。这个概念始自热力学,后被广泛应用于各学科。系统的熵值反映了它所处状态的均匀程度。系统的熵值越小,它所处的状态越有序,越不均匀;系统的熵值越大,它所处的状态越无序,越均匀。在信息论里,熵是不确定性的量度。熵越大说明系统的信息就越少,不确定性就越大,越随机。
在这里我们略过数学细节。最大熵原理的大意是说,在只掌握关于未知分布的部分可检验的知识时,应该选取符合这些知识但熵值最大的概率分布。或者说,充分利用所知道的信息,而对不知道的部分选择信息量更小的可能。
以我的理解,禅定是同样的道理。最大熵原理就是知之为知之,不知为不知;而禅定就是内照所有的已知,而对于外境所有的未知,尽可能少受干扰,少被迷惑。