词条 | hash函数 |
释义 | Hash,一般翻译做"散列",也有直接音译为"哈希"的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。 用途HASH主要用于信息安全领域中加密算法,它把一些不同长度的信息转化成杂乱的128位的编码里,叫做HASH值. 也可以说,hash就是找到一种数据内容和数据存放地址之间的映射关系 了解了hash基本定义,就不能不提到一些著名的hash算法,MD5 和 SHA1 可以说是目前应用最广泛的Hash算法,而它们都是以 MD4 为基础设计的。那么它们都是什么意思呢? 这里简单说一下: 1) MD4MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年设计的,MD 是 Message Digest 的缩写。它适用在32位字长的处理器上用高速软件实现--它是基于 32 位操作数的位操作来实现的。 2) MD5MD5(RFC 1321)是 Rivest 于1991年对MD4的改进版本。它对输入仍以512位分组,其输出是4个32位字的级联,与 MD4 相同。MD5比MD4来得复杂,并且速度较之要慢一点,但更安全,在抗分析和抗差分方面表现更好 3) SHA1 及其他SHA1是由NIST NSA设计为同DSA一起使用的,它对长度小于264的输入,产生长度为160bit的散列值,因此抗穷举(brute-force)性更好。SHA-1 设计时基于和MD4相同原理,并且模仿了该算法。 那么这些Hash算法到底有什么用呢? Hash算法在信息安全方面的应用主要体现在以下的3个方面: 1) 文件校验 我们比较熟悉的校验算法有奇偶校验和CRC校验,这2种校验并没有抗数据篡改的能力,它们一定程度上能检测并纠正数据传输中的信道误码,但却不能防止对数据的恶意破坏。 MD5 Hash算法的"数字指纹"特性,使它成为目前应用最广泛的一种文件完整性校验和(Checksum)算法,不少Unix系统有提供计算md5 checksum的命令。 2) 数字签名 Hash 算法也是现代密码体系中的一个重要组成部分。由于非对称算法的运算速度较慢,所以在数字签名协议中,单向散列函数扮演了一个重要的角色。 对 Hash 值,又称"数字摘要"进行数字签名,在统计上可以认为与对文件本身进行数字签名是等效的。而且这样的协议还有其他的优点。 3) 鉴权协议 如下的鉴权协议又被称作"挑战--认证模式:在传输信道是可被侦听,但不可被篡改的情况下,这是一种简单而安全的方法。 hash函数 - Hash算法的用处Hash算法在信息安全方面的应用主要体现在以下的3个方面: 1) 文件校验 我们比较熟悉的校验算法有奇偶校验和CRC校验,这2种校验并没有抗数据篡改的能力,它们一定程度上能检测并纠正数据传输中的信道误码,但却不能防止对数据的恶意破坏。 MD5 Hash算法的"数字指纹"特性,使它成为目前应用最广泛的一种文件完整性校验和(Checksum)算法,不少Unix系统有提供计算md5 checksum的命令。 2) 数字签名 Hash 算法也是现代密码体系中的一个重要组成部分。由于非对称算法的运算速度较慢,所以在数字签名协议中,单向散列函数扮演了一个重要的角色。 对 Hash 值,又称"数字摘要"进行数字签名,在统计上可以认为与对文件本身进行数字签名是等效的。而且这样的协议还有其他的优点。 3) 鉴权协议 如下的鉴权协议又被称作"挑战--认证模式:在传输信道是可被侦听,但不可被篡改的情况下,这是一种简单而安全的方法。 以上就是一些关于hash以及其相关的一些基本预备知识。那么在emule里面他具体起到什么作用呢? hash函数 - userhash道理同上,当我们在第一次使用emule的时候,emule会自动生成一个值,这个值也是唯一的,它是我们在emule世界里面的标志,只要你不卸载,不删除config,你的userhash值也就永远不变,积分制度就是通过这个值在起作用,emule里面的积分保存,身份识别,都是使用这个值,而和你的id和你的用户名无关,你随便怎么改这些东西,你的userhash值都是不变的,这也充分保证了公平性。其实他也是一个信息摘要,只不过保存的不是文件信息,而是我们每个人的信息。 hash函数 - hash文件我们经常在emule日志里面看到,emule正在hash文件,这里就是利用了hash算法的文件校验性这个功能了,文章前面已经说了一些这些功能,其实这部分是一个非常复杂的过程,目前在ftp,bt等软件里面都是用的这个基本原理,emule里面是采用文件分块传输,这样传输的每一块都要进行对比校验,如果错误则要进行重新下载,这期间这些相关信息写入met文件,直到整个任务完成,这个时候part文件进行重新命名,然后使用move命令,把它传送到incoming文件里面,然后met文件自动删除,所以我们有的时候会遇到hash文件失败,就是指的是met里面的信息出了错误不能够和part文件匹配,另外有的时候开机也要疯狂hash,有两种情况一种是你在第一次使用,这个时候要hash提取所有文件信息,还有一种情况就是上一次你非法关机,那么这个时候就是要进行排错校验了。 关于hash的算法研究,一直是信息科学里面的一个前沿,尤其在网络技术普及的今天,他的重要性越来越突出,其实我们每天在网上进行的信息交流安全验证,我们在使用的操作系统密钥原理,里面都有它的身影,特别对于那些研究信息安全有兴趣的朋友,这更是一个打开信息世界的钥匙,他在hack世界里面也是一个研究的焦点.我是一个门外汉,利用这个周末找了一些资料,胡乱写了一点关于hash的文章,也有不少是我自己的分析,这期间肯定还有不对的地方,还请朋友们多多指出错误,我抛砖引玉希望大家批评指导。 hash函数在程序设计中的实现// 说明:Hash函数(即散列函数)在程序设计中的应用目标 ------ 把一个对象通过某种转换机制对应到一个 // size_t类型(即unsigned long)的整型值。 // 而应用Hash函数的领域主要是 hash表(应用非常广)、密码等领域。 // 实现说明: // (1)、这里使用了函数对象以及泛型技术,使得对所有类型的对象(关键字)都适用。 // (2)、常用类型有对应的偏特化,比如string、char*、各种整形等。 // (3)、版本可扩展,如果你对某种类型有特殊的需要,可以在后面实现专门化。 // (4)、以下实现一般放在头文件中,任何包含它的都可使用hash函数对象。 //------------------------------------实现------------------------------------------------ #include <string> using std::string; inline size_t hash_str( const char* s ) { unsigned long res = 0; for ( ; *s; ++s ) res = 5 * res + *s; return size_t(res); } template <class Key> struct hash { size_t operator () ( const Key& k ) const; }; // 一般的对象,比如:vector< queue<string> >的对象,需要强制转化 template < class Key > size_t hash<Key>::operator () ( const Key& k ) const { size_t res = 0; size_t len = sizeof( Key ); const char* p = reinterpret_cast<const char*>( &k ); while ( len-- ) { res = (res<<1)^*p++; } return res; } // 偏特化 template<> size_t hash< string >::operator () ( const string& str ) const { return hash_str( str.c_str() ); } typedef char* PChar; template<> size_t hash<PChar>::operator () ( const PChar& s ) const { return hash_str(s); } typedef const char* PCChar; template<> size_t hash<PCChar>::operator () ( const PCChar& s ) const { return hash_str(s); } template<> size_t hash<char>::operator () ( const char& x ) const { return x; } template<> size_t hash<unsigned char>::operator () ( const unsigned char& x ) const { return x; } template<> size_t hash<signed char>::operator () ( const signed char& x ) const { return x; } template<> size_t hash<short>::operator () ( const short& x ) const { return x; } template<> size_t hash<unsigned short>::operator () ( const unsigned short& x ) const { return x; } template<> size_t hash<int>::operator () ( const int& x ) const { return x; } template<> size_t hash<unsigned int>::operator () ( const unsigned int& x ) const { return x; } template<> size_t hash<long>::operator () ( const long& x ) const { return x; } template<> size_t hash<unsigned long>::operator () ( const unsigned long& x ) const { return x; } // 使用说明: // // (1)、使用时首先由于是泛型,所以要加上关键字类型。 // // (2)、其次要有一个函数对象,可以临时、局部、全局的,只要在作用域就可以。 // // (3)、应用函数对象作用于对应类型的对象。 //----------------------- hash函数使用举例 ------------------------- #include <iostream> #include <vector> #include <string> using namespace std; int main() { vector<string> vstr(2); vstr[0] = "sjw"; vstr[1] = "suninf"; hash<string> strhash; // 局部函数对象 cout << " Hash value: " << strhash( vstr[0] ) << endl; cout << " Hash value: " << strhash( vstr[1] ) << endl; cout << " Hash value: " << hash< vector<string> >() ( vstr ) << endl; cout << " Hash value: " << hash<int>() ( 100 ) << endl; // hash<int>() 临时函数对象 return 0; } |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。