缘由
腾讯2014校招简答题,更为详细的解法请看:题干
A,B两个整数集合,设计一个算法求他们的交集,尽可能的高效。思路
初步想法是用hash。也可以用布隆过滤器。比如说A集合有元素M个,B集合有元素N个。我们初始化一个max(M,N)的数组,然后hash算法算出其hash值,hash值再对max(M,N)求余数。这样就可以插入到数组中去(用求余后的hash值作为下标),我们也可以用2倍max(M,N)作为数组长度,这样就可以尽可能的避免冲突。当我们插入完A集合的元素后,我们就开始算B集合的元素,如此一来,对每一个B集合的元素都算一次,确定hash值,求余,比对。那么整个过程在时间复杂度最好的情况下,也就是计算M+N次hash值,最多比对M+N次数(发生冲突的情况下,最好的情况就是没有冲突,一算一个准)。即可选出交集。
那么如果不使用上述算法,那么使用最简单的方法,就是比对M*N次。
代码
import java.util.Date;
import java.util.LinkedList;
import java.util.List;
import java.util.Random;
/**
* A,B两个整数集合,设计一个算法求他们的交集,尽可能的高效。
*/
public class test {
public static int setSize = 1000000;
public static int hashSize = setSize * 2;
public static void main(String[] args) {
// TODO Auto-generated method stub
Integer A[] = new Integer[setSize];
Integer B[] = new Integer[setSize];
for(int i=0;i<setSize;i++){
A[i]=(new Random().nextInt(setSize * 10));
B[i]=(new Random().nextInt(setSize * 10));
}
System.out.println("赋值完毕");
long beginTime = System.currentTimeMillis();
Integer hashtable[] = new Integer[hashSize];
//现在将将A集合的数都放到hash表中,以数的hash值为下标,使用开放寻址法来解决冲突
//其实用拉链法更好
for(int i=0;i<setSize;i++){
//取到需要存的数的下标
int index = A[i].toString().hashCode() % hashSize;
if(index<0){
index *= -1;
}
while(hashtable[index]!=null){
if(index >= hashSize-1){
index=0;
}else{
index++;
}
}
hashtable[index] = A[i];
}
List<Integer> result = new LinkedList<Integer>();
//开始对B
for(int i=0;i<setSize;i++){
//取到需要存的数的下标
int index = B[i].toString().hashCode() % hashSize;
if(index<0){
index *= -1;
}
while(hashtable[index]!=null){
if(hashtable[index] == B[i]){
result.add(B[i]);
break;
}
if(index >= hashSize-1){
index=0;
}else{
index++;
}
}
}
if(result.size()!=0){
for(int i=0 ; i<result.size();i++){
System.out.println(result.get(i));
}
}else{
System.out.println("没有相同元素");
}
System.out.println("计算耗时:"+ (System.currentTimeMillis() - beginTime)+" 毫秒");
}
}结果
赋值完毕
81
计算耗时:723 毫秒- 注意每次结果都不一样,因为每次都是随机赋值的。
后记
做完一道题,当你发现别人做的比你好时,还是挺失落的。加油哟!!!版权声明:本文为zy825316原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。