All About Programming: 素数基础篇之素数的个数 - czyuan原创_Keep Moving 永不止步...

上一篇我们对素数的基本判断方法进行了介绍(素数基础篇之素数的判断 - czyuan原创
     http://hi.baidu.com/czyuan_acm/blog/item/8a6f7d88187acd9fa4c2721f.html)

     了解了基本的判断方法后，你是不是有个疑问："我们能判断素数的个数吗？"总所周知，素数的个数是无限的，且没有固定的公式…但如果我们只要判断[a, b]区间(a, b范围为1到1亿)内的素数的个数呢?

     首先，我们可以想到，如果要求的素数个数区间[a, b]，当区间长度比较小(10^6内)，我们可以用筛法求出区间内的所有的素数，然后统计个数即可。
但如果区间长度很长或者要求询问的次数很多，那该怎么办呢? [a,b]区间内素数的个数 = [1, b]的个数 - [1, a - 1]的个数，所以我们这里只讨论求[1, a]区间内的素数。以下提供个人的两种方法，时限都是1s内产生结果。如果哪位大牛有更好的方法，大家一起交流下～～

     1. 我们可以扩展上面的思想，当区间小的时候，我们可以很好的求出素数的个数。那我们可以把大的区间划分成一块块小的区间，比如把一个长度为1亿的区间划分1,000个长度为100,000的区间。我们可以利用Miller-Rabin事先把[1, 100000], [100001, 200000], [200001, 300000]的区间内的素数个数统计好，然后存在一个数组中。
完成这步后，思路就比较清晰：对于区间[1, a]，可以拆分为一个个长度为100000的小区间([1, 100000], [100001, 200000]…)，加上尾部的小区间[c * 100000, a]。前面的小区间只要数组的值相加即可，而后面的小区间[c * 100000, a]，长度在100000内，直接用区间的筛法求出素数，统计个数即可。
     代码：参见上一篇文章的Miller-Rabin，区间求素数的代码。
     该方法速度很快，主要时间都花在数组打表上，然后直接存在数组里，求1到1亿的素数个数时间为0.06s。
     评价：优点是方法速度快，且直接套模板即可。缺点是需要事先打表，且代码长度很长(因为要给长度为1000的数组赋初值)。

     2. 第二种方法涉及到容斥原理(inclusion-exclusion principle)，容斥原理参见(http://en.wikipedia.org/wiki/Inclusion-exclusion_principle)。
      当一个数是合数，那么它可以分解成几个素数的乘积。如30 = 2 * 3 * 5。我们可以统计合数的个数，然后拿总数减它就是素数的个数(注意还要去掉1的)。我们可以利用类似筛法的原理，去除2的倍数(它们肯定是合数，不包括2)，然后去除3的倍数，5的倍数，知道去除到Sqrt(a)的倍数为止。但你会发现6 = 2 * 3，被去除了2次，而这正是容斥原理解决的问题。合数的个数 = 1个素数筛完的合数个数 � 2个素数筛完的合数个数 + 3个素数筛完的合数个数...
而容斥原理的累加过程，即可用DFS来解决。你可能会认为sqrt(1亿) = 10000，其中素数有很多，DFS要跑很长时间。但我们只需要加一些简单的优化即可很大程度地提高程序的效率。

    首先，我们写筛法出1到sqrt(a)的素数表，然后从小到大DFS。
    如果当前的乘积 > a，那么直接退到上一层。
    如果该层的所有乘积不能使总数发生变化(即所有乘积都 > a)，那么直接退回第一层。(因为是从小到大，该层下面的乘积必将 > a)
    如果是第一层的所有乘积不能使总数发生变化，那么程序运行结束。(原理同上)
    经过这样优化后，求1到1亿的时间为0.4秒，1到10亿的时间为3.5s。

     核心代码：
     void Solve(int index, int lcm, int K)
     {
         int i;
         int t, t_temp;
         if (K == 0)
         {
              temp += n / lcm;
               return ;
         }
         for (i = index; i < total - K + 1; i++)
         {
               t = lcm * primelist[i];
               t_temp = temp;
               if (t <= n)
               {
                  Solve(i + 1, t, K - 1);
               }
               if (t_temp == temp) return ; // 剪枝：同样道理，说明以后的K - 1个不能组成我们想要的值
          }
    }

    main()中：
    for (k = 1; k <= total; k++)
    { // 计算size中选k个的总数.
          temp = 0;
          Solve(0, 1, k);
          if (temp == 0) break; // 说明最小的k个乘积都大于n了，那么可以直接break了.
          if (k & 1) ans += temp;
          else ans -= temp;
    }

    评价：该方法巧妙地使用了容斥原理来计数，且DFS应用于容斥原理的剪枝十分重要。

    提到容斥原理，推荐一道前不久做的题目SRM 453.5 DIV 1 1000(http://www.topcoder.com/stat?c=problem_statement&pm=10420&rd=14174)，两题的容斥原理思想差不多，但剪枝方法不同，而且两题的方法交换都会产生超时...(有兴趣一起交流下～～)

Read full article from 素数基础篇之素数的个数 - czyuan原创_Keep Moving 永不止步..._百度空间

素数基础篇之素数的个数 - czyuan原创_Keep Moving 永不止步..._百度空间

No comments:

Post a Comment

Labels

Popular Posts

素数基础篇 之 素数的个数 - czyuan原创_Keep Moving 永不止步..._百度空间

No comments:

Post a Comment

Labels

Popular Posts

素数基础篇之素数的个数 - czyuan原创_Keep Moving 永不止步..._百度空间