277. Find the Celebrity (M)
https://labuladong.github.io/algo/2/19/40/
Last updated
https://labuladong.github.io/algo/2/19/40/
Last updated
今天来讨论经典的「名流问题」:
给你 n
个人的社交关系(你知道任意两个人之间是否认识),然后请你找出这些人中的「名人」。
所谓「名人」有两个条件:
1、所有其他人都认识「名人」。
2、「名人」不认识任何其他人。
这是一个图相关的算法问题,社交关系嘛,本质上就可以抽象成一幅图。
如果把每个人看做图中的节点,「认识」这种关系看做是节点之间的有向边,那么名人就是这幅图中一个特殊的节点:
这个节点没有一条指向其他节点的有向边;且其他所有节点都有一条指向这个节点的有向边。
或者说的专业一点,名人节点的出度为 0,入度为 n - 1
。
那么,这 n
个人的社交关系是如何表示的呢?
前文 图论算法基础 说过,图有两种存储形式,一种是邻接表,一种是邻接矩阵,邻接表的主要优势是节约存储空间;邻接矩阵的主要优势是可以迅速判断两个节点是否相邻。
对于名人问题,显然会经常需要判断两个人之间是否认识,也就是两个节点是否相邻,所以我们可以用邻接表来表示人和人之间的社交关系。
那么,把名流问题描述成算法的形式就是这样的:
给你输入一个大小为 n x n
的二维数组(邻接矩阵) graph
表示一幅有 n
个节点的图,每个人都是图中的一个节点,编号为 0
到 n - 1
。
如果 graph[i][j] == 1
代表第 i
个人认识第 j
个人,如果 graph[i][j] == 0
代表第 i
个人不认识第 j
个人。
有了这幅图表示人与人之间的关系,请你计算,这 n
个人中,是否存在「名人」?
如果存在,算法返回这个名人的编号,如果不存在,算法返回 -1。
函数签名如下:
比如输入的邻接矩阵长这样:
那么算法应该返回 2。
力扣第 277 题「搜寻名人」就是这个经典问题,不过并不是直接把邻接矩阵传给你,而是只告诉你总人数 n
,同时提供一个 API knows
来查询人和人之间的社交关系:
很明显,knows
API 本质上还是在访问邻接矩阵。为了简单起见,我们后面就按力扣的题目形式来探讨一下这个经典问题。
我们拍拍脑袋就能写出一个简单粗暴的算法:
cand
是候选人(candidate)的缩写,我们的暴力算法就是从头开始穷举,把每个人都视为候选人,判断是否符合「名人」的条件。
刚才也说了,knows
函数底层就是在访问一个二维的邻接矩阵,一次调用的时间复杂度是 O(1),所以这个暴力解法整体的最坏时间复杂度是 O(N^2)。
那么,是否有其他高明的办法来优化时间复杂度呢?其实是有优化空间的,你想想,我们现在最耗时的地方在哪里?
对于每一个候选人 cand
,我们都要用一个内层 for 循环去判断这个 cand
到底符不符合「名人」的条件。
这个内层 for 循环看起来就蠢,虽然判断一个人「是名人」必须用一个 for 循环,但判断一个人「不是名人」就不用这么麻烦了。
因为「名人」的定义保证了「名人」的唯一性,所以我们可以利用排除法,先排除那些显然不是「名人」的人,从而避免 for 循环的嵌套,降低时间复杂度。
我再重复一遍所谓「名人」的定义:
1、所有其他人都认识名人。
2、名人不认识任何其他人。
这个定义就很有意思,它保证了人群中最多有一个名人。
这很好理解,如果有两个人同时是名人,那么这两条定义就自相矛盾了。
换句话说,只要观察任意两个候选人的关系,我一定能确定其中的一个人不是名人,把他排除。
至于另一个候选人是不是名人,只看两个人的关系肯定是不能确定的,但这不重要,重要的是排除掉一个必然不是名人的候选人,缩小了包围圈。
这是优化的核心,也是比较难理解的,所以我们先来说说为什么观察任意两个候选人的关系,就能排除掉一个。
你想想,两个人之间的关系可能是什么样的?
无非就是四种:你认识我我不认识你,我认识你你不认识我,咱俩互相认识,咱两互相不认识。
如果把人比作节点,红色的有向边表示不认识,绿色的有向边表示认识,那么两个人的关系无非是如下四种情况:
不妨认为这两个人的编号分别是 cand
和 other
,然后我们逐一分析每种情况,看看怎么排除掉一个人。
对于情况一,cand
认识 other
,所以 cand
肯定不是名人,排除。因为名人不可能认识别人。
对于情况二,other
认识 cand
,所以 other
肯定不是名人,排除。
对于情况三,他俩互相认识,肯定都不是名人,可以随便排除一个。
对于情况四,他俩互不认识,肯定都不是名人,可以随便排除一个。因为名人应该被所有其他人认识。
综上,只要观察任意两个之间的关系,就至少能确定一个人不是名人,上述情况判断可以用如下代码表示:
如果能够理解这一个特点,那么写出优化解法就简单了。
我们可以不断从候选人中选两个出来,然后排除掉一个,直到最后只剩下一个候选人,这时候再使用一个 for 循环判断这个候选人是否是货真价实的「名人」。
这个思路的完整代码如下:
这个算法避免了嵌套 for 循环,时间复杂度降为 O(N) 了,不过引入了一个队列来存储候选人集合,使用了 O(N) 的空间复杂度。
PS:
LinkedList
的作用只是充当一个容器把候选人装起来,每次找出两个进行比较和淘汰,但至于具体找出哪两个,都是无所谓的,也就是说候选人归队的顺序无所谓,我们用的是addFirst
只是方便后续的优化,你完全可以用addLast
,结果都是一样的。
是否可以进一步优化,把空间复杂度也优化掉?
如果你能够理解上面的优化解法,其实可以不需要额外的空间解决这个问题,代码如下:
我们之前的解法用到了 LinkedList
充当一个队列,用于存储候选人集合,而这个优化解法利用 other
和 cand
的交替变化,模拟了我们之前操作队列的过程,避免了使用额外的存储空间。
现在,解决名人问题的解法时间复杂度为 O(N),空间复杂度为 O(1),已经是最优解法了。