请输入您要查询的百科知识:

 

词条 水塘抽样
释义

简介

水塘抽样是一系列的随机算法,其目的在于从包含n个项目的集合S中选取k个样本,其中n为一很大或未知的数量,尤其适用于不能把所有n个项目都存放到主内存的情况。最常见例子为Jeffrey Vitter在其论中所提及的算法R。

算法步骤

参照Dictionaryof Algorithms and Data Structures所载的O(n)算法,包含以下步骤(假设阵列S以0开始标示):

从S中抽取首k项放入「水塘」中对于每一个S[j]项(j ≥ k):

随机产生一个范围从0到j的整数r

若 r < k 则把水塘中的第r项换成S[j]项

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/1/9 7:14:47