词条 | 矩阵乘法 |
释义 | 矩阵乘法是一种高效的算法可以把一些一维递推优化到log( n ),还可以求路径方案等,所以更是是一种应用性极强的算法。矩阵,是线性代数中的基本概念之一。一个m×n的矩阵就是m×n个数排成m行n列的一个数阵。由于它把许多数据紧凑的集中到了一起,所以有时候可以简便地表示一些复杂的模型。矩阵乘法看起来很奇怪,但实际上非常有用,应用也十分广泛。 基本定义它是这样定义的,只有当矩阵A的列数与矩阵B的行数相等时A×B才有意义。一个m×n的矩阵a(m,n)左乘一个n×p的矩阵b(n,p),会得到一个m×p的矩阵c(m,p),满足 矩阵乘法满足结合律,但不满足交换律 一般的矩乘要结合快速幂才有效果。(基本上所有矩阵乘法都要用到快速幂的) 在数学中,一个矩阵说穿了就是一个二维数组。一个n行m列的矩阵可以乘以一个m行p列的矩阵,得到的结果是一个n行p列的矩阵,其中的第i行第j列位置上的数等于前一个矩阵第i行上的m个数与后一个矩阵第j列上的m个数对应相乘后所有m个乘积的和。比如,下面的算式表示一个2行2列的矩阵乘以2行3列的矩阵,其结果是一个2行3列的矩阵。其中,结果的那个4等于2*2+0*1: 矩阵乘法的c语言程序: #include<stdio.h> float main() { float a[100][100],b[100][100],c[100][100];//定义三个数组,分别存储矩阵A,B,C int m1,n1,m2,n2,i1,j1,i2,j2,i3,j3,i4,j4,k; float s[100][100]={0};//赋值使数组s元素初值全部为零 printf("请输入矩阵A行数m1,列数n1:");//输入矩阵A行数,列数 scanf("%d,%d",&m1,&n1); printf("请输入矩阵B行数m2,列数n2:");//输入矩阵B行数,列数 scanf("%d,%d",&m2,&n2); printf("\\");//如果不可以相乘,下面将出现判断,在此换行,便于观看 if(n1!=m2) printf("不可以相乘!!!");//判断是否可以相乘 printf("\\"); if((m1>100)||(n1>100)) printf("数目过多!!!");//控制矩阵A元素数量在数组容纳范围内 else { for(i1=1;i1<=m1;i1++) { for(j1=1;j1<=n1;j1++) { printf("a[%d][%d]=:",i1,j1); scanf("%f",&a[i1][j1]);//输入矩阵A元素 } } } printf("\");//分隔开A,B的元素输入,便于观看 if((m2>100)||(n2>100)) printf("数目过多!!!"); else { for(i2=1;i2<=m2;i2++) { for(j2=1;j2<=n2;j2++) { printf("b[%d][%d]=:",i2,j2); scanf("%f",&b[i2][j2]);//输入矩阵B元素 } } } printf("矩阵A:\");//输出矩阵A,便于观看,检验 for(i3=1;i3<=m1;i3++) { for(j3=1;j3<=n1;j3++) { printf("%f ",a[i3][j3]); if(j3==n1) printf("\"); } } printf("\");//与矩阵B的输出结果隔开,便于观看 printf("矩阵B:\");//输出矩阵A,便于观看,检验 for(i4=1;i4<=m2;i4++) { for(j4=1;j4<=n2;j4++) { printf("%f ",b[i4][j4]); if(j4==n2) printf("\"); } } printf("\"); printf("矩阵C=A*B:\"); for(i4=1;i4<=m1;i4++) { for(j4=1;j4<=n2;j4++) { for(k=1;k<=n1;k++) { s[i4][j4]=s[i4][j4]+a[i4][k]*b[k][j4];//定义矩阵乘法,相乘时,有一个指标是一样的,都用k } c[i4][j4]=s[i4][j4];//定义矩阵乘法 printf("%f ",c[i4][j4]); if(j4==n2) printf("\");//控制在列指标到达N时换行 } } return 0; } 程序运行结果示例:一般矩乘的代码:function mul( a , b : Tmatrix ) : Tmatrix; var i,j,k : longint; c : Tmatrix; begin fillchar( c , sizeof( c ) , 0 ); for k:=0 to n do for i:=0 to m do for j:=0 to p do begin inc( c[ i , j ] , a[ i , k ]*b[ k , j ] ); if c[ i , j ] > ra then c[ i , j ]:=c[ i , j ] mod ra; end; mul:=c; end; 这里我们不介绍其它有关矩阵的知识,只介绍矩阵乘法和相关性质。 不要以为数学中的矩阵也是黑色屏幕上不断变化的绿色字符。在数学中,一个矩阵说穿了就是一个二维数组。一个n行m列的矩阵可以乘以一个m行p列的矩阵,得到的结果是一个n行p列的矩阵,其中的第i行第j列位置上的数等于前一个矩阵第i行上的m个数与后一个矩阵第j列上的m个数对应相乘后所有m个乘积的和。比如,下面的算式表示一个2行2列的矩阵乘以2行3列的矩阵,其结果是一个2行3列的矩阵。其中,结果的那个4等于2*2+0*1:右面的算式则是一个1 x 3的矩阵乘以3 x 2的矩阵,得到一个1 x 2的矩阵: 矩阵乘法的两个重要性质: 一,矩阵乘法不满足交换律;二,矩阵乘法满足结合律。为什么矩阵乘法不满足交换律呢?因为交换后两个矩阵有可能不能相乘。为什么它又满足结合律呢?假设你有三个矩阵A、B、C,那么(AB)C和A(BC)的结果的第i行第j列上的数都等于所有A(ik)*B(kl)*C(lj)的和(枚举所有的k和l)。 了解矩阵相关符号 以下是一个 4 × 3 矩阵: 某矩阵 A 的第 i 行第 j 列,或 i,j位,通常记为 A[i,j] 或 Ai,j。在上述例子中 A[2,3]=7。 在C语言中,亦以 A[j] 表达。(值得注意的是,与一般矩阵的算法不同,在C中,"行"和"列"都是从0开始算起的) 此外 A = (aij),意为 A[i,j] = aij 对于所有 i 及 j,常见于数学著作中。 一般环上构作的矩阵 给出一环 R,M(m,n, R) 是所有由 R 中元素排成的 m× n 矩阵的集合。若 m=n,则通常记以 M(n,R)。这些矩阵可加可乘 (请看下面),故 M(n,R) 本身是一个环,而此环与左 R 模Rn 的自同态环同构。 若 R 可置换, 则 M(n, R) 为一带单位元的 R-代数。其上可以莱布尼茨公式定义 行列式:一个矩阵可逆当且仅当其行列式在 R 内可逆。 除特别指出,一个矩阵多是实数矩阵或虚数矩阵。 分块矩阵: 分块矩阵 是指一个大矩阵分割成“矩阵的矩阵”。举例,以下的矩阵 可分割成 4 个 2×2 的矩阵,矩阵将多种信号自由控制,将BSV液晶拼接跨屏显示。 此法可用于简化运算,简化数学证明,以及一些电脑应用如VLSI芯片设计等。 特殊矩阵类别对称矩阵是相对其主对角线(由左上至右下)对称, 即是 ai,j=aj,i。 埃尔米特矩阵(或自共轭矩阵)是相对其主对角线以复共轭方式对称, 即是 ai,j=a*j,i。 特普利茨矩阵在任意对角线上所有元素相对, 是 ai,j=ai+1,j+1。 随机矩阵所有列都是概率向量, 用于马尔可夫链。 此外,还有对角矩阵,单位矩阵,条带矩阵 对角矩阵是仅在它的主对角线上有元素而其他位置上的元素全为零(即aij= 0或i≠j)的矩阵。如图为nXn的对角矩阵: 类似的是单位矩阵,但位于主对角线上的元素都是1,即a1=a2=......=an=1 条带矩阵是指与主对角线平行的位置上有非零元素而其他位置的元素全为零的矩阵来源 英文名Matrix(SAMND矩阵)。在数学名词中,矩阵用来表示统计数据等方面的各种有关联的数据。这个定义很好地解释了Matrix代码制造世界的数学逻辑基础。 成书于西汉末、东汉初的《九章算术》用分离系数法表示线性方程组,得到了其增广矩阵。在消元过程中,使用的把某行乘以某一非零实数、从某行中减去另一行等运算技巧,相当于矩阵的初等变换。但当时并没有现在理解的矩阵概念,虽然它与现在的矩阵形式上相同,但在当时只是作为线性方程组的标准表示与处理方式。 矩阵的现代概念在19世纪逐渐形成。1801年德国数学家高斯(F.Gauss,1777~1855)把一个线性变换的全部系数作为一个整体。1844年,德国数学家爱森斯坦(F.Eissenstein,1823~1852)讨论了“变换”(矩阵)及其乘积。1850年,英国数学家西尔维斯特(James Joseph Sylvester,18414-1897)首先使用矩阵一词。1858年,英国数学家凯莱(A.Gayley,1821~1895)发表《关于矩阵理论的研究报告》。他首先将矩阵作为一个独立的数学对象加以研究,并在这个主题上首先发表了一系列文章,因而被认为是矩阵论的创立者,他给出了现在通用的一系列定义,如两矩阵相等、零矩阵、单位矩阵、两矩阵的和、一个数与一个矩阵的数量积、两个矩阵的积、矩阵的逆、转置矩阵等。并且凯莱还注意到矩阵的乘法是可结合的,但一般不可交换,且m*n矩阵只能用n*k矩阵去右乘。1854年,法国数学家埃米尔特(C.Hermite,1822~1901)使用了“正交矩阵”这一术语,但他的正式定义直到1878年才由德国数学家费罗贝尼乌斯(F.G.Frohenius,1849~1917)发表。1879年,费罗贝尼乌斯引入矩阵秩的概念。 至此,矩阵的体系基本上建立起来了。 制作步骤制作矩阵图一般要遵循以下几个步骤: ①列出质量因素: ②把成对对因素排列成行和列,表示其对应关系 ③选择合适的矩阵图类型 ④在成对因素交点处表示其关系程度,一般凭经验进行定性判断,可分为三种:关系密切、关系较密切、关系一般(或可能有关系),并用不同符号表示 ⑤根据关系程度确定必须控制的重点因素 ⑥针对重点因素作对策表。 经典题目给定n个点,m个操作,构造O(m+n)的算法输出m个操作后各点的位置。操作有平移、缩放、翻转和旋转 这里的操作是对所有点同时进行的。其中翻转是以坐标轴为对称轴进行翻转(两种情况),旋转则以原点为中心。如果对每个点分别进行模拟,那么m个操作总共耗时O(mn)。利用矩阵乘法可以在O(m)的时间里把所有操作合并为一个矩阵,然后每个点与该矩阵相乘即可直接得出最终该点的位置,总共耗时O(m+n)。假设初始时某个点的坐标为x和y,下面5个矩阵可以分别对其进行平移、旋转、翻转和旋转操作。预先把所有m个操作所对应的矩阵全部乘起来,再乘以(x,y,1),即可一步得出最终点的位置。 给定矩阵A,请快速计算出A^n(n个A相乘)的结果,输出的每个数都mod p。 由于矩阵乘法具有结合律,因此A^4 = A * A * A * A = (A*A) * (A*A) = A^2 * A^2。我们可以得到这样的结论:当n为偶数时,A^n = A^(n/2) * A^(n/2);当n为奇数时,A^n = A^(n/2) * A^(n/2) * A (其中n/2取整)。这就告诉我们,计算A^n也可以使用二分快速求幂的方法。例如,为了算出A^25的值,我们只需要递归地计算出A^12、A^6、A^3的值即可。根据这里的一些结果,我们可以在计算过程中不断取模,避免高精度运算。 POJ3233 题目大意:给定矩阵A,求A + A^2 + A^3 + ... + A^k的结果(两个矩阵相加就是对应位置分别相加)。输出的数据mod m。k<=10^9。 这道题两次二分,相当经典。首先我们知道,A^i可以二分求出。然后我们需要对整个题目的数据规模k进行二分。比如,当k=6时,有: A + A^2 + A^3 + A^4 + A^5 + A^6 =(A + A^2 + A^3) + A^3*(A + A^2 + A^3) 应用这个式子后,规模k减小了一半。我们二分求出A^3后再递归地计算A + A^2 + A^3,即可得到原问题的答案。 VOJ1049 题目大意:顺次给出m个置换,反复使用这m个置换对初始序列进行操作,问k次置换后的序列。m<=10, k<2^31。 首先将这m个置换“合并”起来(算出这m个置换的乘积),然后接下来我们需要执行这个置换k/m次(取整,若有余数则剩下几步模拟即可)。注意任意一个置换都可以表示成矩阵的形式。例如,将1 2 3 4置换为3 1 2 4,相当于下面的矩阵乘法: 置换k/m次就相当于在前面乘以k/m个这样的矩阵。我们可以二分计算出该矩阵的k/m次方,再乘以初始序列即可。做出来了别忙着高兴,得意之时就是你灭亡之日,别忘了最后可能还有几个置换需要模拟。 《算法艺术与信息学竞赛》207页(2.1代数方法和模型,[例题5]细菌,版次不同可能页码有偏差) 大家自己去看看吧,书上讲得很详细。解题方法和上一题类似,都是用矩阵来表示操作,然后二分求最终状态。 给定n和p,求第n个Fibonacci数mod p的值,n不超过2^31 根据前面的一些思路,现在我们需要构造一个2 x 2的矩阵,使得它乘以(a,b)得到的结果是(b,a+b)。每多乘一次这个矩阵,这两个数就会多迭代一次。那么,我们把这个2 x 2的矩阵自乘n次,再乘以(0,1)就可以得到第n个Fibonacci数了。不用多想,这个2 x 2的矩阵很容易构造出来: VOJ1067 我们可以用上面的方法二分求出任何一个线性递推式的第n项,其对应矩阵的构造方法为:在右上角的(n-1)*(n-1)的小矩阵中的主对角线上填1,矩阵第n行填对应的系数,其它地方都填0。例如,我们可以用下面的矩阵乘法来二分计算f(n) = 4f(n-1) - 3f(n-2) + 2f(n-4)的第k项: 利用矩阵乘法求解线性递推关系的题目我能编出一卡车来。这里给出的例题是系数全为1的情况。 给定一个有向图,问从A点恰好走k步(允许重复经过边)到达B点的方案数mod p的值 把给定的图转为邻接矩阵,即A(i,j)=1当且仅当存在一条边i->j。令C=A*A,那么C(i,j)=ΣA(i,k)*A(k,j),实际上就等于从点i到点j恰好经过2条边的路径数(枚举k为中转点)。类似地,C*A的第i行第j列就表示从i到j经过3条边的路径数。同理,如果要求经过k步的路径数,我们只需要二分求出A^k即可。 经典题目9用1 x 2的多米诺骨牌填满M x N的矩形有多少种方案,M<=5,N<2^31,输出答案mod p的结果 我们以M=3为例进行讲解。假设我们把这个矩形横着放在电脑屏幕上,从右往左一列一列地进行填充。其中前n-2列已经填满了,第n-1列参差不齐。现在我们要做的事情是把第n-1列也填满,将状态转移到第n列上去。由于第n-1列的状态不一样(有8种不同的状态),因此我们需要分情况进行讨论。在图中,我把转移前8种不同的状态放在左边,转移后8种不同的状态放在右边,左边的某种状态可以转移到右边的某种状态就在它们之间连一根线。注意为了保证方案不重复,状态转移时我们不允许在第n-1列竖着放一个多米诺骨牌(例如左边第2种状态不能转移到右边第4种状态),否则这将与另一种转移前的状态重复。把这8种状态的转移关系画成一个有向图,那么问题就变成了这样:从状态111出发,恰好经过n步回到这个状态有多少种方案。比如,n=2时有3种方案,111->011->111、111->110->111和111->000->111,这与用多米诺骨牌覆盖3x2矩形的方案一一对应。这样这个题目就转化为了我们前面的例题8。 后面我写了一份此题的源代码。你可以再次看到位运算的相关应用。 经典题目10POJ2778 题目大意是,检测所有可能的n位DNA串有多少个DNA串中不含有指定的病毒片段。合法的DNA只能由ACTG四个字符构成。题目将给出10个以内的病毒片段,每个片段长度不超过10。数据规模n<=2 000 000 000。 下面的讲解中我们以ATC,AAA,GGC,CT这四个病毒片段为例,说明怎样像上面的题一样通过构图将问题转化为例题8。我们找出所有病毒片段的前缀,把n位DNA分为以下7类:以AT结尾、以AA结尾、以GG结尾、以?A结尾、以?G结尾、以?C结尾和以??结尾。其中问号表示“其它情况”,它可以是任一字母,只要这个字母不会让它所在的串成为某个病毒的前缀。显然,这些分类是全集的一个划分(交集为空,并集为全集)。现在,假如我们已经知道了长度为n-1的各类DNA中符合要求的DNA个数,我们需要求出长度为n时各类DNA的个数。我们可以根据各类型间的转移构造一个边上带权的有向图。例如,从AT不能转移到AA,从AT转移到??有4种方法(后面加任一字母),从?A转移到AA有1种方案(后面加个A),从?A转移到??有2种方案(后面加G或C),从GG到??有2种方案(后面加C将构成病毒片段,不合法,只能加A和T)等等。这个图的构造过程类似于用有限状态自动机做串匹配。然后,我们就把这个图转化成矩阵,让这个矩阵自乘n次即可。最后输出的是从??状态到所有其它状态的路径数总和。 题目中的数据规模保证前缀数不超过100,一次矩阵乘法是三方的,一共要乘log(n)次。因此这题总的复杂度是100^3 * log(n),AC了。 最后给出第9题的代码供大家参考(今天写的,熟悉了一下C++的类和运算符重载)。为了避免大家看代码看着看着就忘了,我把这句话放在前面来说: Matrix67原创,转贴请注明出处。 #include <cstdio> #define SIZE (1<<m) #define MAX_SIZE 32 using namespace std; class CMatrix { public: long element[MAX_SIZE][MAX_SIZE]; void setSize(int); void setModulo(int); CMatrix operator* (CMatrix); CMatrix power(int); private: int size; long modulo; }; void CMatrix::setSize(int a) { for (int i=0; i<a; i++) for (int j=0; j<a; j++) element[i][j]=0; size = a; } void CMatrix::setModulo(int a) { modulo = a; } CMatrix CMatrix::operator* (CMatrix param) { CMatrix product; product.setSize(size); product.setModulo(modulo); for (int i=0; i<size; i++) for (int j=0; j<size; j++) for (int k=0; k<size; k++) { product.element[i][j]+=element[i][k]*param.element[k][j]; product.element[i][j]%=modulo; } return product; } CMatrix CMatrix::power(int exp) { CMatrix tmp = (*this) * (*this); if (exp==1) return *this; else if (exp & 1) return tmp.power(exp/2) * (*this); else return tmp.power(exp/2); } int main() { const int validSet[]={0,3,6,12,15,24,27,30}; long n, m, p; CMatrix unit; scanf("%d%d%d", &n, &m, &p); unit.setSize(SIZE); for(int i=0; i<SIZE; i++) for(int j=0; j<SIZE; j++) if( ((~i)&j) == ((~i)&(SIZE-1)) ) { bool isValid=false; for (int k=0; k<8; k++)isValid=isValid||(i&j)==validSet[k]; unit.element[i][j]=isValid; } unit.setModulo(p); printf("%d", unit.power(n).element[SIZE-1][SIZE-1] ); return 0; } 其它如:斐波那契数列:{ F(n) } = { 1 1 } ^(n-2) * { 1 } F(n-1) 1 0 1 矩阵乘法算法传统算法: 若依定义来计算A和B的乘积矩阵C,则每计算C的一个元素C[i][j],需要做n次乘法和n-1次加法。因此,算出矩阵C的个元素所需的计算时间为O(n3) Strassen矩阵乘法: T(n)=O(nlog7) =O(n2.81) 时间复杂度有了较大改进! 目前最好的计算时间上界是O(n2.376) |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。