并查集讲解(按秩合并与路径压缩),模板与典型例题

一种并查集操作的套路

点击链接

引入

并查集就是一些集合。
这个集合有两种操作
并集,即把两个集合合并
查询,即查询一个点在哪个集合内(就是查询所在集合的顶点)
这里的顶点意思就是当前集合所有的点最终指向的点
怎么操作呢?
将两个集合合并的时候,就是将一个集合的顶点指向另一个集合的顶点,也就是将一个顶点的父亲赋值为另一个顶点
但是如果题目出的让你一个接一个的加入集合,就会导致长度很长,导致时间超限

优化

第一种:路径压缩

发现在查询和合并时都只需要知道顶点就行了,那么在进行查询时,查询到的是这个点所在集合的顶点,那就直接把这个点指向顶点,之后的查询就在查询到这个点时,就会直接跳向顶点,速度快了很多

程序

利用C++特性可以写的很短
fa[x]为x的父亲,就是x指向的点,初始时全为0

查询

int gf(int x)
{
	return fa[x]==0?x:fa[x]=gf(fa[x]);
}

太简略了,可能看不懂,分开来看看

int gf(int x)
{
	if(fa[x]==0) return x;
	int y=gf(fa[x]);
	fa[x]=y;              //路径压缩 
	return y;
}

当然,把fa[x]的初始值设为x也是可以的,那样可以使用下面这种优化(常数优化)

int gf(int x)
{
	return fa[x]==x?x:fa[x]=gf(fa[fa[fa[fa[x]]]]);
}

为什么能优化?很显然吧

修改

将点x和y合并

x=gf(x);
y=gf(y);
if(x!=y) fa[x]=y;

第二种:按秩合并

给每个点一个秩,其实就是树高
每次合并的时候都用秩小的指向秩大的,可以保证树高最高为l o g 2 ( n ) log_2(n)log2(n)
操作的时候,一开始所有点的秩都为1
在一次合并后,假设是点x和点y,x的秩小
当然x和y都是原来x和y所在区间的顶点
设点x秩为rank[x]
将fa[x]指向y,然后将rank[y]的与rank[x+1]取max
因为rank[x]为区间x的高,将它连向y之后,y的树高就会是x的树高+1,当然也可能y在另一边树高更高,所以取max

程序

同样,fa[x]为x的父亲,就是x指向的点,rank[x]为点x的秩

查询

int gf(int x)
{
	return fa[x]==0?x:gf(fa[x]);
}

和上面一样,不说了

修改

x=gf(x);y=gf(y);
if(x!=y)
{
	if(rank[x]<=rank[y])fa[x]=yrank[y]=max(rank[y],rank[x]+1);
	else fa[y]=x,rank[x]=max(rank[x],rank[y]+1);
}

就和我上面的解释是一样的


典型例题

NOI2002Day2银河英雄传说

题目描述

公元五八○一年,地球居民迁移至金牛座α第二行星,在那里发表银河联邦创立宣言,同年改元为宇宙历元年,并开始向银河系深处拓展。
宇宙历七九九年,银河系的两大军事集团在巴米利恩星域爆发战争。泰山压顶集团派宇宙舰队司令莱因哈特率领十万余艘战舰出征,气吞山河集团点名将杨威利组织麾下三万艘战舰迎敌。
杨威利擅长排兵布阵,巧妙运用各种战术屡次以少胜多,难免恣生骄气。在这次决战中,他将巴米利恩星域战场划分成30000列,每列依次编号为1, 2, …, 30000。之后,他把自己的战舰也依次编号为1, 2, …, 30000,让第i号战舰处于第i列(i = 1, 2, …, 30000),形成“一字长蛇阵”,诱敌深入。这是初始阵形。当进犯之敌到达时,杨威利会多次发布合并指令,将大部分战舰集中在某几列上,实施密集攻击。合并指令为M i j,含义为让第i号战舰所在的整个战舰队列,作为一个整体(头在前尾在后)接至第j号战舰所在的战舰队列的尾部。显然战舰队列是由处于同一列的一个或多个战舰组成的。合并指令的执行结果会使队列增大。
然而,老谋深算的莱因哈特早已在战略上取得了主动。在交战中,他可以通过庞大的情报网络随时监听杨威利的舰队调动指令。
在杨威利发布指令调动舰队的同时,莱因哈特为了及时了解当前杨威利的战舰分布情况,也会发出一些询问指令:C i j。该指令意思是,【询问电脑,杨威利的第i号战舰与第j号战舰当前是否在同一列中,如果在同一列中,那么它们之间布置有多少战舰。】
作为一个资深的高级程序设计员,你被要求编写程序分析杨威利的指令,以及回答莱因哈特的询问。
最终的决战已经展开,银河的历史又翻过了一页……

输入

输入文件galaxy.in的第一行有一个整数T(1<=T<=500,000),表示总共有T条指令。
以下有T行,每行有一条指令。指令有两种格式:

  1. M i j :i和j是两个整数(1<=i , j<=30000),表示指令涉及的战舰编号。该指令是莱因哈特窃听到的杨威利发布的舰队调动指令,并且保证第i号战舰与第j号战舰不在同一列。
  2. C i j :i和j是两个整数(1<=i , j<=30000),表示指令涉及的战舰编号。该指令是莱因哈特发布的询问指令。

输出

输出文件为galaxy.out。你的程序应当依次对输入的每一条指令进行分析和处理:
如果是杨威利发布的舰队调动指令,则表示舰队排列发生了变化,你的程序要注意到这一点,但是不要输出任何信息;
如果是莱因哈特发布的询问指令,你的程序要输出一行,仅包含一个整数,表示在同一列上,第i号战舰与第j号战舰之间布置的战舰数目。如果第i号战舰与第j号战舰当前不在同一列上,则输出-1。

样例输入

4
M 2 3
C 1 2
M 2 4
C 4 2

样例输出

-1
1
数据范围限制
1<=T<=500,000
(1<=i , j<=30000)

两个战舰是否在同一列用并查集维护。注意细节
同时维护每个战舰在这一列的第几个。当两列合并时维护即可。

code

因为是好久以前做的题了,只有Pascal代码,见谅

var
    c1,c:char;
    i,j,n,k,x,y,a,b:longint;
    fa,w,s:array[1..500000] of longint;
function getfather(a:longint):longint;
var
    x:longint;
begin
    if fa[a]=0 then getfather:=a
    else
    begin
        x:=getfather(fa[a]);
        inc(w[a],w[fa[a]]-1);
        fa[a]:=x;
        getfather:=x;
    end;
end;
begin
    assign(input,'galaxy.in'); reset(input);
    assign(output,'galaxy.out'); rewrite(output);
    readln(n);
    for i:=1 to n do
    begin
        w[i]:=1;
        s[i]:=1;
        fa[i]:=0;
    end;
    for i:=1 to n do
    begin
        read(c,c1);
        readln(x,y);
        if c='M' then
        begin
            a:=getfather(x);
            b:=getfather(y);
            fa[a]:=b;
            w[a]:=s[b]+1;
            s[b]:=s[b]+s[a];
        end
        else
        begin
            a:=getfather(x);
            b:=getfather(y);
            if a<>b then writeln('-1')
            else writeln(abs(w[x]-w[y])-1);
        end;
    end;
    close(input); close(output);
end.

版权声明:本文为u011056504原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。