1、素数筛（这应该是最全的总结了，四种基本方法，7种优化方法）

您所在的位置：网站首页 › 数学质数表书签 › 1、素数筛（这应该是最全的总结了，四种基本方法，7种优化方法）

1、素数筛（这应该是最全的总结了，四种基本方法，7种优化方法）

2023-11-30 02:01| 来源: 网络整理| 查看: 265

素数筛基本介绍

素数问题是数学领域中的基本问题，也是程序设计或者面试笔试中的常见问题。计算机的诞生，让素数的计算过程大大加快。

本文是这段时间我个人学习素数相关知识的阶段性总结，也是对知识的记录和分享。

希望和大家一起学习、一起进步。以后还会陆续更新其他方面的知识。

首先，明确素数的定义：

质数(素数)是指在大于 1 的**自然数**中，除了 1 和它本身以外不再有其他因数的自然数。—“质数(素数)百度百科”

根据素数这一定义，可以提炼出几点内容

素数是自然数，因此是整数素数是大于1的自然数，因此小于等于1的数字都不是素数（包括负数，0和小数）素数只有两个因数，1和自身结合1,2,3点，可以推断出，在自然数范围内，最小的素数是2

同时根据这一定义，发展出许多计算素数的方法，以下让我一一介绍。

小技巧，sqrt赋值给一个变量

算法 1、朴素算法 1.1、试除法

朴素算法即最为直观的算法，这里只是根据素数的定义而设计的算法，没有涉及其他方面的知识。

根据素数的定义：素数只有两个因子，1和自身。

因此如果有其他因子的数字，都不是素数，这类数字称之为合数，概念上和素数相对。

从因子这一点入手，根据因子个数的多少，判断一个数字是否为素数。

这里采用试除法，正如字面意思一样，尝试相除。要判断n是否为素数，则在[2，n-1]范围内，逐一枚举数字，对每一素数，尝试用n去除。

如果可以被整除，则说明枚举的数字是n的因子。根据素数定义，数字n非素数如果不可以被整除，则需要继续往后枚举，查看其他枚举数字相除之后的结果如果后面有可以被整除的数字，则结果和上面第一条一样。如果在[2，n-1]范围内都没有可以被整除的数字，则说明数字n在[1，n]范围内只有1和n两个因子，因此n是素数。

程序代码

时间复杂度为O(n)

#include int IsPrime(int n) { int i; //素数是指在大于 1 的自然数中，除了1和它本身以外不再有其他因数的自然数。 if(n//n=2时，直接跳过了此循环，返回结果1。 if(n%i==0) return 0; } return 1; } } int main() { int n; printf("请输入要检验的数字\n"); while(scanf("%d",&n)!=EOF) { if(IsPrime(n)==1) printf("%d是素数\n\n",n); else printf("%d不是素数\n\n",n); } return 0; } 1.2、优化方法一

上面的方法，是最容易想到的，但是效率并不高。如果在小范围内求素数可以，但n的规模一旦变大，就需要耗费很长的时间。

这里介绍两种优化方法，对上面的方法、程序进行一点优化。尽管这一点优化在大规模数据面前微不足道，但这种方式还是很值得去学习。

上面的程序，是在[2，n-1]范围内进行试除，那么是否可以缩小试除的范围呢？

我们注意到，一个数字x如果有其他因子a,b，则可以写成x=a*b的形式。a和b是一种负相关的关系，不会同时变大或者变小。当a最小为2,时，b最大为x/2。而a最大也只能为x/2，因为b最小只能为2。因此，可以推断出，x如果有其他因子，那么这个因子一定是在[2，x/2]范围内。基本原理和上面一致，都是试除法。在新的范围内如果没有可以整除的数字，那么就说明n没有其他因子，说明n是素数。

因此这样就把范围缩小到n/2，进行了一点优化

程序代码

时间复杂度为O(n/2)

#include int IsPrime(int n) { int i,m; if(n//2和3不能保证区间右侧大于左侧，但是这两个数字是素数，因此没有关系。 if(n%i==0) return 0; } return 1; } } int main()//主函数不变 { int n; printf("请输入要检验的数字\n"); while(scanf("%d",&n)!=EOF) { if(IsPrime(n)==1) printf("%d是素数\n\n",n); else printf("%d不是素数\n\n",n); } return 0; } 1.3、优化方法二

这里介绍另外一种优化方法

让我们换一种思路，不从范围入手，而是从数字的性质入手。

奇数和偶数是我们最常接触的一种分类方法，让我们从这里入手。

偶数是可以整除2的数字，那么这就说明偶数大概率不是素数（数字2除外），因为有个因子2。因此素数都是奇数

奇数不可以被2整除，也不可以被2的倍数整除。因此奇数不需要判定偶数因子，只需要判定奇数因子即可

素数都是奇数这个大家应该都认可，可能有的人对奇数不可以被2整除，也不可以被2的倍数整除这句话有点不理解，这里简单证明一下

设x是个奇数，那么x%2=1。设2的倍数为2*k。如果x可以被2*k整除，那么就是x%(2*k)=0。这里设商为a，即x/(2*k)=a

即x/2/k=a，那么把k移到右边就是x/2=k*a。这就说明x是偶数，与最开始的假设相悖。因此x是奇数时，不可以被2的整数倍整除。

经过上面两点，就可以减少判断的次数。当判定的数字是奇数时，就不需要在进行偶数因子的判定。奇数和偶数交错分布，那这样就可以少判断一半的范围，进行了一定程度的优化。

程序代码

时间复杂度为O(n/2)

#include int IsPrime(int n) { int i; if(n if(n%i==0) return 0; } return 1; } } int main()//主函数不变 { int n; printf("请输入要检验的数字\n"); while(scanf("%d",&n)!=EOF) { if(IsPrime(n)==1) printf("%d是素数\n\n",n); else printf("%d不是素数\n\n",n); } return 0; } 1.4、优化方法三

上面介绍了两种优化方法，这里第三种优化方法，就是把前面两种方法结合起来。在方法二的基础上，加上方法一。

即方法二是指判断n以内的奇数因子，加上方法一之后，就只判断n/2以内的奇数因子。两因子中一个因子取2时，另外一个因子才取n/2。而这里n是奇数，不可以取2，因此另外一个因子是小于n/2的。

注意：

并不是什么优化操作都可以叠加使用，要注意彼此之间的原理，是否冲突，是否会影响正确性这里优化方法一是从因子分布区间入手，无论n如何，都成立。优化方法二是从n的性质入手。两者之间并不冲突优化方法一中，因子的范围是[2，n/2]，极端情况下分布在两端，因此两端都可取。而在优化方法二中，因为左侧不可取，所以右侧也不可取，所以因子范围是(2，n/2)

程序代码

时间复杂度O(n/4)

#include int IsPrime(int n) { int i,m; if(n if(n%i==0) return 0; } return 1; } } int main()//主函数不变 { int n; printf("请输入要检验的数字\n"); while(scanf("%d",&n)!=EOF) { if(IsPrime(n)==1) printf("%d是素数\n\n",n); else printf("%d不是素数\n\n",n); } return 0; } 2、优化的朴素算法 2.1、算法介绍

上面介绍了三种优化方法，实际上是两种，但最好的情况也只是把时间复杂度从O(n)降到了O(n/4)。

那么是否有更好的优化方法呢？

在上面的方法二中，因子虽然都是在[2，n/2]这个范围内，但因子在数轴上，总是一个前一个后。在此范围内，如果前半部分都没有找到因子，那么必然后半部分的数字也不是因子。那么这个前后的分界线在哪里呢？

聪明的你可能想到，或者已经知道了，这个分界线就是根号n，下面用sqrt(n)表示。

这里对朴素的素数判定方法进行一点优化。

数字的因子有一个特点，就是成对出现的（两个成对的因子相乘才等于原来的数字），并且成对出现的因子分布在sqrt(n)的两侧

简单证明一下为什么一定分布在sqrt(n)两侧：假设k=sqrt(n)，那么k*k=n

如果成对的两个因子不分布在k的两侧，比如同时大于k或者同时小于k。因为k*k=n，那么这两个成对因子相乘的结果要么是大于n，要么是小于n。既然相乘结果都不是n，那么就不是n的因子，则与最开始的假设相悖。

得到上面的性质之后，就可以对朴素算法再进行优化。

因为因子是成对出现，并且分布在sqrt(n)两侧。那么判断数字有无其他因子的时候，判断范围可以从[2，n-1]缩小到[ 2，sqrt(n) ]。（如果[2， sqrt(n) ]没有因子，那么[ sqrt(n) ， n-1]也不会有因子。原因就是前面提到的，因子是成对出现的）

程序代码

时间复杂度O(sqrt(n))

#include #include//sqrt的头文件 int IsPrime(int n) { int i,m; if(n//数字的因子是成对出现的，且分布在sqrt(n)两侧。因此判断一侧没有因子，就可知另一侧也没有 if(n%i==0)//其他步骤不变 return 0; } return 1; } } int main()//主函数不变 { int n; printf("请输入要检验的数字\n"); while(scanf("%d",&n)!=EOF) { if(IsPrime(n)==1) printf("%d是质数\n\n",n); else printf("%d不是质数\n\n",n); } return 0; }

关于Isprime函数，其中还可以另外一种写法，就不需要用sqrt函数开根

int IsPrime(int n) { int i; if(n//这里应该取等号，需要取到i=sqrt(n)这个值 if(n%i==0) return 0; } return 1; } } 2.2、小优化方法

这里可以利用之前提到过的1.3中的优化方法再进行优化。只对奇数进行素数判断，并且只判定奇数因子。

原因是什么？这里再简单重复一遍

偶数（除了2以外）必然不是素数，素数必然是奇数奇数不能被2的整数倍整除，因此奇数的因子中必然没有2的整数倍(偶数)，也就不需要判定偶数是否为奇数的因子

程序代码

int IsPrime(int n) { int i; if(n//2必然不是因子，从3开始，每次递增2，直到sqrt(n)为止 if(n%i==0) return 0; } return 1; } } 3、素数筛-埃氏筛(埃拉托斯特尼筛法)

这里介绍另外一种找素数的方法。

上面的朴素算法以及各种优化方法，都是对给定的单一数字进行判断，从而得知这个数字是否为素数。但在实际问题中，往往需要获取一个区间内所有素数，或者在短时间内多次查询判断。应对这样的需求，我们会进行预处理：对某一区间进行素数挑选，把素数挑选出来，存储到另外一个地方或者标记起来。

要实现这样的预处理，使用上面的朴素算法，就需要双层循环，这样时间复杂度大概是O(n^2)

接下来介绍的这两种算法，正好是把某一区间内的素数都筛选出来，且时间复杂度也不高。

3.1、简单介绍–引入

让我们再次回顾素数(质数)的定义

质数(素数)是指在大于 1 的**自然数**中，除了 1 和它本身以外不再有其他因数的自然数。—“质数(素数)百度百科”

上面的朴素算法，我们是尝试把数字拆分为因子相乘的形式，对范围区间内的数字进行判断时，，则需要对每个数字都进行拆分，那么我们是否可以使用另外一种方式呢？

这里我们选择另外一种方式：反向构造。

我们事先不知道一个数是否为素数，但是我们可以创造出合数（非素数）。

数字可以划分为素数和合数两大类，那么当我们把某一范围内的合数都标记出来，则剩下的数字就是素数。

如何构造合数呢？在大于1的数字中任取两个数字a，b相乘即可，这样得到的结果c必然有1，a，b，c四个因子（当a=b时为三个因子）那么c必然是合数

总结成算法就是

设定两个数组，一个数组包括范围内的所有数字，用来标记此数字是否被访问过；另外一个数组用来存储已经筛选出来的素数（如果仅仅是查询某个数是否为素数，则访问数组就可以实现这个功能，素数数组是方便筛选过程结束后可以输出筛选出的素数）将访问数组中访问标记设为未访问，将素数数组清空，将0，1等非素数访问标记设为已访问（素数标记是设为未访问还是已访问，根据自己的逻辑习惯设定）从2开始循环，直到范围的上界，判断每一个数字是否被访问过，访问过的是非素数（合数），未访问过的是素数接着对这个数字进行倍增操作，从两倍开始，直到若干倍后到达上界为止，这其中得到的数字结果的访问标记都设为已访问。重复步骤3,4，直至3中循环结束

这里步骤4中是第二个循环，用来进行倍增操作，凡是在此过程中得到的数字，都是构造出来的合数。而步骤3中，循环到当前数字未被访问过，则此数字是素数。因为如果此数字是合数的话，那么它的因子一定是小于自身的。那么在前面从小数开始循环的时候，就会遇到因子，更会在这个因子倍增的过程中，把数字给标记掉。所以如果步骤3访问当某个数字是未标记时，那么这个数字一定是素数。

举例说明：12是合数，有2,3,4,6；从小数开始循环、倍增时，2倍增时会把12标记掉，同样地，3,4,6也会把12标记掉。所以如果访问到a未被标记，那么a一定是素数

这个算法的好处就是，利用了一次倍增，得到了后面若干个数字的结果。循环到这些数字的时候，就不再需要花时间去计算，直接可以得到结果。这里用了一个必不可少的标记数组，花费了一定的空间。**这里实际上就是典型的用空间来换取时间。**花费更多的内存空间，来换取时间的减少。时间和空间的取舍，也讲求经济性

程序代码

这里就不提时间复杂度了。这里整个过程像个筛子一样，把不要的合数筛下去，剩下的就是所需的素数。

#include #include//memset函数的头文件 //设定一个宏，定义数组大小 #define maxn 20010 int vis[maxn];//vis用来判断数字是否访问过 int prime[maxn];//prime用来存储筛选出来的素数 int sieve(int n) { int i,j,k; k=0;//i用来控制逐个访问，j用来第二轮标记，k用来标记prime数组位置 //这里在函数中置为0，保证每一次函数调用时都清空，不会受到上次使用完后的结果 //理论上需要这样做，但是在此程序中可以省略，因为数字范围彼此之间是子集的关系，而范围的改变不会改变数字的性质 memset(vis,0,sizeof(int)*maxn);//将访问数组清零。可以使用short或者C++的bool类型节省内存、 vis[0]=vis[1]=1;//将0和1标记为已访问，不标记其实也可以，因为我们素数的计数是从2开始 for(i=2;i int i; for(i=0;i int n;//求n以内的素数 int k;//保存返回的素数个数 while(scanf("%d",&n)!=EOF) { k=sieve(n); if(k==0) printf("(1-%d]范围内没有素数\n",n); else printf("(1-%d]范围内的素数有:\n",n); print(k); } }

函数中另外一种写法

int sieve(int n) { int i,j,k; k=0; vis[0]=vis[1]=1; for(i=2;i int i,j,k; k=0; memset(vis,0,sizeof(int)*maxn); vis[0]=vis[1]=1; for(i=2;i prime[k++]=i;//因此这个数是素数,存储起来 for(j=2;i*j printf("%5d ",prime[i]);//每个数字占5个宽度，右对齐，保持输出结果整洁 if((i+1)%5==0)//每五个为一组换行 printf("\n"); } printf("\n\n"); } int main() { int n; int k;//保存返回的素数个数 while(scanf("%d",&n)!=EOF) { k=Eratosthenes_sieve(n); if(k==0) printf("(1-%d]范围内没有素数\n",n); else printf("(1-%d]范围内的素数有:\n",n); print(k); } } 3.3、优化方法一

再次观察上面的程序，会发现优化之后，仍然会有重复标记的情况出现，这是为什么呢？

仔细观察之后，发现是倍增的起点选择问题。上面的程序每次都是从2倍开始倍增，如果想要不重复标记，则需要从 i 倍开始倍增。

假设现在 i=b，如果从2倍开始倍增，将会标记b*2这个数，而这个数实际上在2倍增b倍的时候，就已经标记了。所以每次倍增应该从 i 开始，从 i^2开始标记。

这就相当于这张九九乘法表，如果没有从 i*i 开始，从2倍开始，就会标记第2列到第9列中的所有内容。如果从 i*i 开始，那标记的就是对角线部分+表格的上三角白色部分。这样就很明显看出，小小的一点改动，就节约了将近一半的计算。

程序代码

这里就不提时间复杂度了

//埃氏素数筛函数 int Eratosthenes_sieve(int n) { int i,j,k; k=0; memset(vis,0,sizeof(int)*maxn); vis[0]=vis[1]=1; for(i=2;i prime[k++]=i; for(j=i;i*j vis[i+1]=1;//把偶数的标记补上 //这里存在大于n的风险，因此需要把数组开大一点 //如果是i-1，则当n为偶数时，n的标记不能补上 if(vis[i]==0) { prime[k++]=i; for(j=i;i*j if(vis[i]==0)//对素数进行倍增 { for(j=i;i*j int i,j,k; k=0;//保存素数的个数 memset(vis,0,sizeof(int)*maxn);//初始化数组 for(i=2;i if(i*prime[j]>n)//倍增结果超出范围，退出 break; vis[ i*prime[j] ]=1;//将倍增结果进行标记 if(i%prime[j]==0)//i是前面某个素数的倍数时，也需要退出 break; } } return k; }

代码中，最关键是这条语句

if(i%prime[j]==0) break;

这条语句的加入，保证了每个合数只会被筛除一次，不会被重复筛除。那么为什么？

当 i 可以整除素数表中某个素数时，那么 i 就不需要在往后乘以其他素数了，因此往后乘以得到的结果，会以另外一种方式得到。

用公式解释就是

当 i%prime[j]==0时，i*prime[j+1]的结果，可以通过另外一种方式得到，比如说 x*prime[j]，即x*prime[j]=i*prime[j+1]

i%prime[j]==0 说明prime[j]是i的一个素因子，并且是最小的素因子(因为是最早接触的素因子)，所以i可以表示为a*prime[j]的形式

那么i*prime[j+1]即等于a*prime[j]*prime[j+1]的，所以i*prime[j+1]的结果，也是prime[j]的倍数，当i往后继续循环到x的时候，就会有x*prime[j]出现，就把之前的结果给补回来了。

prime[j+1]是这种结果，往后的j+2,j+3等等也是类似的结果，因此这里就可以退出循环，等到i循环到x的时候，再把这个合数结果筛除。

这里合数到了prime[i]就退出了，因此后面的素数没有倍增的机会，即这个合数不会被其他素因子倍增到。(不会出现2*6=3*4=12等重复标记的情况出现)

因此每个合数只被其最小的素因子筛除，不会被其他素因子筛除，因此欧拉筛中每个合数只会被筛除一次，不会被重复筛除。

举例说明就是

比如i=12，此时素数数组中有素数2,3,5,7,11

2*12=24，把24筛除了，但是判定12可以整除2，2是12的最小素因子(是因子，且是素数因子)，此时循环退出。

为什么呢？

因为12*3=36这个结果可以通过12的最小素因子2，以其他方式得到。36这个结果，当x=18时可以通过18*2得到。同样的，后面的素数*12得到结果，也可以通过另外的x与2相乘得到。比如12*5=60，可以通过30*2得到

上面使用公式进行了解释，这里再说明一下，2是12的最小素因子，12可以被2整除，那么12乘以其他的素数得到的结果，也同样可以被2整除，得到的商就是那个x。因此这里就不再第二层循环中往后乘，而是跳出第二层循环，进入第一层循环。等到第一层循环中循环到了合适的i=x时，就可以复现此时的结果。因此这个合数并不会被忽略，而只是筛除的过程滞后了。

这样的滞后操作，保证了每一个合数，只被筛除一次，不会被重复筛除。这种筛除方式，就是欧拉筛算法最前面提到的，使用最小素因子筛除。

6、区间筛

这里挖个坑，过段时间补上

6、素数筛总结

这里给出一点编程小技巧：

如果是用作标记，可以选择用更小的数据类型进行存储，比如说short，bool类型。甚至经过巧妙设计之后，可以使用位来标记循环中尽量不要出现表达式，可在外面用变量存储表达式的值，再放入循环中。避免每循环一次，都要重新计算一次

求素数的几种方法：

判断单个数字是否为素数试除法（穷举法）优化方法一：范围缩小到n/2，原因是合数因子范围为[2，n/2]优化方法二：使用奇偶数性质优化，原因是素数是奇数，奇数不能被2的整数倍(偶数)整除优化方法三：上面两种方法结合优化到sqrt(n)的试除法，原因是因子成对且分布在sqrt(n)两侧，检测一侧即可优化方法一：使用奇偶性质优化，原因不重复筛选区间范围内的素数埃氏筛引入中，利用任何数字的倍数都不是素数的性质埃氏筛，只对素数进行倍增，利用唯一分解定理，合数必然可以分解出素因子优化方法一：倍增从 i 开始优化方法二：只对奇数进行素数判定，以为素数一定是奇数优化方法三：开平方优化，同样是因为数字的因子成对出现且分布在sqrt(n)两侧欧拉筛 1.

这里有多种优化方法，有的甚至是多种优化方法复合使用。但在复合使用前，需要先判断一下这样做是否会影响程序的正确性。

【本文地址】

公司简介

联系我们