请输入您要查询的百科知识:

 

词条 FastICA
释义

摘要

独立成分分析(Independent Component Analysis,ICA)是近年来提出的非常有效的数据分析工具,它主要用来从混合数据中提取出原始的独立信号。它作为信号分离的一种有效方法而受到广泛的关注。

在诸多ICA算法中,固定点算法 (也称FastlCA)以其收敛速度快、分离效果好被广泛应用于信号处理领域。该算法能很好地从观测信号中估计出相互统计独立的、被未知因素混合的原始信号。

FastICA简介

近几年出现了一种快速ICA算法(Fast ICA),该算法是基于定点递推算法得到的,它对任何类型的数据都适用,同时它的存在对运用ICA分析高维的数据成为可能。又称固定点(Fixed-Point)算法,是由芬兰赫尔辛基大学Hyvärinen等人提出来的。是一种快速寻优迭代算法,与普通的神经网络算法不同的是这种算法采用了批处理的方式,即在每一步迭代中有大量的样本数据参与运算。但是从分布式并行处理的观点看该算法仍可称之为是一种神经网络算法。FastICA算法有基于四阶累积量、基于似然最大、基于负熵最大等形式。此外,该算法采用了定点迭代的优化算法,使得收敛更加快速、稳健。用流程图的形式表现算法的流程如图:

FastICA算法的优点

较普通的ICA算法,它具有以下优点:

1)收敛速度快。在 ICA数据模型的假设下,FastICA收敛速度是3次的(或至少是2次的),而普通的ICA算法收敛速度仅仅是线性的。

2)和基于梯度的算法相比,快速定点算法不需要选择步长参数,说明该算法更加易于使用。

3)能通过使用一个非线性函数g便能直接找出任何非高斯分布的独立分量。而对于其他的算法来说,它们首先必须进行概率密度分布函数的估计,然后才相应地进行非线性的选择,因而必须选择非线性。

4)FastICA算法的性能能够通过选择一个适当的非线性函数g而使其达到最佳化。特别是能得到最小方差的算法。

5)独立分量可被逐个估计出来,在探索性数据分析里是非常有用的,这类似于做投影追踪,这在仅需要估计几个(不是全部)独立分量的情况下,能极大地减小计算量。

FastlCA算法本质上是一种最小化估计分量互信息的神经网络方法,是利用最大熵原理来近似负熵,并通过一个合适的非线性函数g使其达到最优。这个算法具有很多神经算法里的优点:并行的、分布的、计算简单、要求内存小。如果要估计多个分量。

FastICA算法的说明

1)对观测信号去均值是ICA算法最基本和最必须的预处理步骤,其处理过程是从观测中减去信号的均值向量,使得观测信号成为零均值变量。该预处理只是为了简化 ICA算法,并不意味着均值不能估计出来。

2)一般情况下所获得的数据都具有相关性,通常都要求对数据进行初步的白化或球化处理,因为白化处理可去除各观测信号之间的相关性,从而简化后续独立分量的提取过程。通常情况下,数据进行白化处理与不对数据进行白化处理相比,算法的收敛性较好,有更好的稳定性。

3)对多个独立分量的估计,需要将最大非高斯性的方法加以扩展。对应于不同独立分量的向量在白化空间中应是正交的,算法第6步用压缩正交化保证分离出来的是不同的信号,但是该方法的缺点是第1个向量的估计误差会累计到随后向量的估计上。

简单地说快速ICA算法通过三步完成:首先,对观测信号去均值;然后,对去均值后的观测信号白化处理;前两步可以看成是对观测信号的预处理,通过去均值和白化可以简化ICA算法。最后,独立分量提取算法及实现流程见流程图。

FastICA算法的方法输出向量,在排列顺序的时候可能出现颠倒和输出信号幅度发生变化。这主要是由于ICA的算法存在2个内在的不确定性导致的:

1)输出向量排列顺序的不确定性,即无法确定所提取的信号对应原始信号源的哪一个分量;

2)输出信号幅度的不确定性,即无法恢复到信号源的真实幅度。

但由于主要信息都包含在输出信号中,这2种不确定性并不影响其应用。

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/2/26 0:24:19