图论起源于18世纪。第一篇图论论文是瑞士数学家欧拉于1736 年发表的“哥尼斯堡的七座桥”。1847年,克希霍夫为了给出电网络方程而引进了“树”的概念。1857年,凯莱在计数烷CnH2n2的同分异构物时,也发现了“树”。哈密尔顿于1859年提出“周游世界”游戏,用图论的术语,就是如何找出一个连通图中的生成圈,近几十年来,由于计算机技术和科学的飞速发展,大大地促进了图论研究和应用,图论的理论和方法已经渗透到物理、化学、通讯科学、建筑学、生物遗传学、心理学、经济学、社会学等学科中。
图论中所谓的“图”是指某类具体事物和这些事物之间的联系。如果我们用点表示这些具体事物,用连接两点的线段(直的或曲的)表示两个事物的特定的联系,就得到了描述这个“图”的几何形象。图论为任何一个包含了一种二元关系的离散系统提供了一个数学模型,借助于图论的概念、理论和方法,可以对该模型求解。哥尼斯堡七桥问题就是一个典型的例子。在哥尼斯堡有七座桥将普莱格尔河中的两个岛及岛与河岸联结起来问题是要从这四块陆地中的任何一块开始通过每一座桥正好一次,再回到起点。当
然可以通过试验去尝试解决这个问题,但该城居民的任何尝试均未成功。欧拉为了解决这个问题,采用了建立数学模型的方法。他将每一块陆地用一个点来代替,将每一座桥用连接相应两点的一条线来代替,从而得到一个有四个“点”,七条“线”的“图”。问题成为从任一点出发一笔画出七条线再回到起点。欧拉考察了一般一笔
画的结构特点,给出了一笔画的一个判定法则:这个图是连通的,且每个点都与偶数线相关联,将这个判定法则应用于七桥问题,得到了“不可能走通”的结果,不但彻底解决了这个问题,而且开创了图论研究的先河。
图与网络是运筹学(Operations Research)中的一个经典和重要的分支,所研究的问题涉及经济管理、工业工程、交通运输、计算机科学与信息技术、通讯与网络技术等诸多领域。下面将要讨论的最短路问题、最大流问题、最小费用流问题和匹配问题等都是图与网络的基本问题。
我们首先通过一些例子来了解网络优化问题。 例1 最短路问题(SPP-shortest path problem)
一名货柜车司机奉命在最短的时间内将一车货物从甲地运往乙地。从甲地到乙地的公路网纵横交错,因此有多种行车路线,这名司机应选择哪条线路呢?假设货柜车的运行速度是恒定的,那么这一问题相当于需要找到一条从甲地到乙地的最短路。
例2 公路连接问题
某一地区有若干个主要城市,现准备修建高速公路把这些城市连接起来,使得从其中任何一个城市都可以经高速公路直接或间接到达另一个城市。假定已经知道了任意两个城市之间修建高速公路的成本,那么应如何决定在哪些城市间修建高速公路,使得总成本最小?
例3 指派问题(assignment problem)
一家公司经理准备安排N名员工去完成N项任务,每人一项。由于各员工的特点不同,不同的员工去完成同一项任务时所获得的回报是不同的。如何分配工作方案可以使总回报最大?
例4 中国邮递员问题(CPP-chinese postman problem)
一名邮递员负责投递某个街区的邮件。如何为他(她)设计一条最短的投递路线(从邮局出发,经过投递区内每条街道至少一次,最后返回邮局)?由于这一问题是我国管梅谷教授1960年首先提出的,所以国际上称之为中国邮递员问题。
例5 旅行商问题(TSP-traveling salesman problem)
一名推销员准备前往若干城市推销产品。如何为他(她)设计一条最短的旅行路线(从驻地出发,经过每个城市恰好一次,最后返回驻地)?这一问题的研究历史十分悠久,通常称之为旅行商问题。
例6 运输问题(transportation problem)
某种原材料有M个产地,现在需要将原材料从产地运往N个使用这些原材料的工厂。假定M个产地的产量和N家工厂的需要量已知,单位产品从任一产地到任一工厂的运费已知,那么如何安排运输方案可以使总运输成本最低?
上述问题有两个共同的特点:一是它们的目的都是从若干可能的安排或方案中寻求某种意义下的最优安排或方案,数学上把这种问题称为最优化或优化(optimization)问题;二是它们都易于用图形的形式直观地描述和表达,数学上把这种与图相关的结构称为网络(network)。与图和网络相关的最优化问题就是网络最优化或称网络优化 (netwok optimization)问题。所以上面例子中介绍的问题都是网络优化问题。由于多数网络优化问题是以网络上的流(flow)为研究的对象,因此网络优化又常常被称为网络流(network flows)或网络流规划等。
下面首先简要介绍图与网络的一些基本概念。
§2 图与网络的基本概念
2.1 无向图
一个无向图(undirected graph)G是由一个非空有限集合V(G)和V(G)中某些元素的无序对集合E(G)构成的二元组,记为G(V(G),E(G))。其中(vertex set)或节点集(node set), V(G)V(G){v1,v2,,vn}称为图G的顶点集
中的每一个元素vi(i1,2,,n)称为该图的一个顶点(vertex)或节点(node);,E(G)中的每一个元素ek(即E(G){e1,e2,,em}称为图G的边集(edge set)
V(G)中某两个元素vi,vj的无序对) 记为ek(vi,vj)或ekvivjvjvi (k1,2,,m),被称为该图的一条从vi到vj的边(edge)。
当边ekvivj时,称vi,vj为边ek的端点,并称vj与vi相邻(adjacent);边ek称为与顶点vi,vj关联(incident)。如果某两条边至少有一个公共端点,则称这两条边在图G中相邻。
边上赋权的无向图称为赋权无向图或无向网络(undirected network)。我们对图和网络不作严格区分,因为任何图总是可以赋权的。
一个图称为有限图,如果它的顶点集和边集都有限。图G的顶点数用符号|V|或(G)表示,边数用|E|或(G)表示。
当讨论的图只有一个时,总是用G来表示这个图。从而在图论符号中我们常略去字母G,例如,分别用V,E,和代替V(G),E(G),(G)和(G)。
端点重合为一点的边称为环(loop)。
一个图称为简单图(simple graph),如果它既没有环也没有两条边连接同一对顶点。
2.2 有向图
G是由一个非空有限集合V和V定义 一个有向图(directed graph或 digraph)中某些元素的有序对集合A构成的二元组,记为G(V,A)。其中
V{v1,v2,,vn}称为图G的顶点集或节点集, V中的每一个元素vi(i1,2,,n)称为该图的一个顶点或节点;A{a1,a2,,am}称为图G的弧集
(arc set),A中的每一个元素ak(即V中某两个元素vi,vj的有序对) 记为。 ak(vi,vj)或akvivj(k1,2,,n),被称为该图的一条从vi到vj的弧(arc)
当弧akvivj时,称vi为ak的尾(tail),vj为ak的头(head),并称弧ak为vi的出弧(outgoing arc),为vj的入弧(incoming arc)。
对应于每个有向图D,可以在相同顶点集上作一个图G,使得对于D的每条
弧,G有一条有相同端点的边与之相对应。这个图称为D的基础图。反之,给定任意图G,对于它的每个边,给其端点指定一个顺序,从而确定一条弧,由此得到一个有向图,这样的有向图称为G的一个定向图。
以下若未指明“有向图”三字,“图”字皆指无向图。 2.3 完全图、二分图
每一对不同的顶点都有一条边相连的简单图称为完全图(complete graph)。n个顶点的完全图记为Kn。
若V(G)XY,XY,|X||Y|0(这里|X|表示集合X中的元素个数),X中无相邻顶点对,Y中亦然,则称G为二分图(bipartite graph);特别地,若xX,yY,则xyE(G),则称G为完全二分图,记成K|X|,|Y|。
2.4 子图
图H叫做图G的子图(subgraph),记作HG,如果V(H)V(G),
E(H)E(G)。若H是G的子图,则G称为H的母图。
G的支撑子图(spanning subgraph,又成生成子图)是指满足V(H)V(G)的
子图H。
2.5 顶点的度
设vV(G),G中与v关联的边数(每个环算作两条边)称为v的度(degree),记作d(v)。若d(v)是奇数,称v是奇顶点(odd point);d(v)是偶数,称v是偶顶点(even point)。关于顶点的度,我们有如下结果:
(i)
d(v)2
vV(ii) 任意一个图的奇顶点的个数是偶数。 2.6 图与网络的数据结构
网络优化研究的是网络上的各种优化模型与算法.为了在计算机上实现网络优化的算法,首先我们必须有一种方法(即数据结构)在计算机上来描述图与网络。一般来说,算法的好坏与网络的具体表示方法,以及中间结果的操作方案是有关系的。这里我们介绍计算机上用来描述图与网络的5种常用表示方法:邻接矩阵表示法、关联矩阵表示法、弧表表示法、邻接表表示法和星形表示法。在下面数据结构的讨论中,我们首先假设G(V,A)是一个简单有向图,|V|n,|A|m,并假设
V中的顶点用自然数1,2,,n表示或编号,A中的弧用自然数1,2,,m表示或编
号。对于有多重边或无向网络的情况,我们只是在讨论完简单有向图的表示方法之后,给出一些说明。
(i)邻接矩阵表示法
邻接矩阵表示法是将图以邻接矩阵(adjacency matrix)的形式存储在计算机中。图G(V,A)的邻接矩阵是如下定义的:C是一个nn的01矩阵,即
C(cij)nn{0,1} cijnn,
1,(i,j)A,
0,(i,j)A.也就是说,如果两节点之间有一条弧,则邻接矩阵中对应的元素为1;否则为0。可以看出,这种表示法非常简单、直接。但是,在邻接矩阵的所有n个元素中,只有m个为非零元。如果网络比较稀疏,这种表示法浪费大量的存储空间,从而增加了在网络中查找弧的时间。
例7 对于右图所示的图,可以用邻接矩阵表示为
200000110000101000
01010110同样,对于网络中的权,也可以用类似邻接矩阵的nn矩阵表示。只是此时一条弧所对应的元素不再是1,而是相应的权而已。如果网络中每条弧赋有多种权,则可以用多个矩阵表示这些权。
(ii)关联矩阵表示法
关联矩阵表示法是将图以关联矩阵(incidence matrix)的形式存储在计算机中.图G(V,A)的关联矩阵B是如下定义的:B是一个nm的矩阵,即
B(bik)nm{1,0,1}nm,
1,jV,k(i,j)A, bik1, jV,k(j,i)A,0,其它.
也就是说,在关联矩阵中,每行对应于图的一个节点,每列对应于图的一条弧。如果一个节点是一条弧的起点,则关联矩阵中对应的元素为1;如果一个节点是一条弧的终点,则关联矩阵中对应的元素为1;如果一个节点与一条弧不关联,则关联矩阵中对应的元素为0。对于简单图,关联矩阵每列只含有两个非零元(一个
1,一个1)。可以看出,这种表示法也非常简单、直接。但是,在关联矩阵的
所有nm个元素中,只有2m个为非零元。如果网络比较稀疏,这种表示法也会浪费大量的存储空间。但由于关联矩阵有许多特别重要的理论性质,因此它在网络优化中是非常重要的概念。
例8 对于例7所示的图,如果关联矩阵中每列对应弧的顺序为(1,2),(1,3),(2,4),(3,2),(4,3),(4,5),(5,3)和(5,4),则关联矩阵表示为
100000011011000011010 0100010110100001110同样,对于网络中的权,也可以通过对关联矩阵的扩展来表示。例如,如果网络中每条弧有一个权,我们可以把关联矩阵增加一行,把每一条弧所对应的权存储在增加的行中。如果网络中每条弧赋有多个权,我们可以把关联矩阵增加相应的行数,把每一条弧所对应的权存储在增加的行中。
(iii)弧表示法
弧表表示法将图以弧表(arc list)的形式存储在计算机中。所谓图的弧表,也就是图的弧集合中的所有有序对。弧表表示法直接列出所有弧的起点和终点,共需
2m个存储单元,因此当网络比较稀疏时比较方便。此外,对于网络图中每条弧上
的权,也要对应地用额外的存储单元表示。例如,例7所示的图,假设弧(1,2),(1,3),(2,4),(3,2),(4,3),(4,5),(5,3)和(5,4)上的权分别为8,9,6,4,0,3,6和7,则弧表表示如下: 起点 终点 权
为了便于检索,一般按照起点、终点的字典序顺序存储弧表,如上面的弧表就是按照这样的顺序存储的。
(iv)邻接表表示法
邻接表表示法将图以邻接表(adjacency lists)的形式存储在计算机中。所谓图的邻接表,也就是图的所有节点的邻接表的集合;而对每个节点,它的邻接表就是它的所有出弧。邻接表表示法就是对图的每个节点,用一个单向链表列出从该节点出发的所有弧,链表中每个单元对应于一条出弧。为了记录弧上的权,链表中每个单元除列出弧的另一个端点外,还可以包含弧上的权等作为数据域。图的整个邻接表可以用一个指针数组表示。例如,例7所示的图,邻接表表示为
1 2 8 1 3 9 2 4 6 3 2 4 4 3 0 4 5 3 5 3 6 5 4 7
这是一个5维指针数组,每一维(上面表示法中的每一行)对应于一个节点的邻接表,如第1行对应于第1个节点的邻接表(即第1个节点的所有出弧)。每个指针单元的第1个数据域表示弧的另一个端点(弧的头),后面的数据域表示对应弧上的权。如第1行中的“2”表示弧的另一个端点为2(即弧为(1,2)),“8”表示对应弧(1,2)上的权为8;“3”表示弧的另一个端点为3(即弧为(1,3)),“9”表示对应弧(1,3)上的权为9。又如,第5行说明节点5出发的弧有(5,3)、(5,4),他们对应的权分别为6和7。
对于有向图G(V,A),一般用A(i)表示节点i的邻接表,即节点i的所有出弧构成的集合或链表(实际上只需要列出弧的另一个端点,即弧的头)。例如上面例子,A(1){2,3},A(5){3,4}等。这种记法我们在本书后面将会经常用到。
(v)星形表示法
星形(star)表示法的思想与邻接表表示法的思想有一定的相似之处。对每个节点,它也是记录从该节点出发的所有弧,但它不是采用单向链表而是采用一个单一的数组表示。也就是说,在该数组中首先存放从节点1出发的所有弧,然后接着存放从节点2出发的所有孤,依此类推,最后存放从节点n出发的所有孤。对每条弧,要依次存放其起点、终点、权的数值等有关信息。这实际上相当于对所有弧给出了一个顺序和编号,只是从同一节点出发的弧的顺序可以任意排列。此外,为了能够快速检索从每个节点出发的所有弧,我们一般还用一个数组记录每个节点出发的弧的起始地址(即弧的编号)。在这种表示法中,可以快速检索从每个节点出发的所有弧,这种星形表示法称为前向星形(forward star)表示法。
例如,在例7所示的图中,仍然假设弧(1,2),(l,3),(2,4),(3,2),(4,3),(4,5),(5,3)和(5,4)上的权分别为8,9,6,4,0,3,6和7。此时该网络图可以用前向星形表示法表示如下:
节点对应的出弧的起始地址编号数组(记为point)
节点号i 起始地址point(i)
1 1 2 3 3 4 4 6 5 7 6 9 记录弧信息的数组 弧编号 起点 终点 权 在数组point中,其元素个数比图的节点数多1(即n1),且一定有
1 1 2 8 2 1 3 9 3 2 4 6 4 3 2 4 5 4 3 0 6 4 5 3 7 5 3 6 8 5 4 7 point(1)1,point(n1)m1。对于节点i,其对应的出弧存放在弧信息数
组的位置区间为
[point(i),point(i1)1],
如果point(i)point(i1),则节点i没有出弧。这种表示法与弧表表示法也非常相似,“记录弧信息的数组”实际上相当于有序存放的“弧表”。只是在前向星形表示法中,弧被编号后有序存放,并增加一个数组(point)记录每个节点出发的弧的起始编号。
前向星形表示法有利于快速检索每个节点的所有出弧,但不能快速检索每个节点的所有入弧。为了能够快速检索每个节点的所有入孤,可以采用反向星形(reverse star)表示法:首先存放进入节点1的所有孤,然后接着存放进入节点2的所有弧,依此类推,最后存放进入节点n的所有孤。对每条弧,仍然依次存放其起点、终点、权的数值等有关信息。同样,为了能够快速检索从每个节点的所有入弧,我们一般还用一个数组记录每个节点的入孤的起始地址(即弧的编号)。例如,例7所示的图,可以用反向星形表示法表示为如下形式:
节点对应的入弧的起始地址编号数组(记为rpoint)
节点号i 起始地址rpoint(i) 记录弧信息的数组 弧编号 终点 起点 权 如果既希望快速检索每个节点的所有出弧,也希望快速检索每个节点的所有入弧,则可以综合采用前向和反向星形表示法。当然,将孤信息存放两次是没有必要的,可以只用一个数组(trace)记录一条弧在两种表示法中的对应关系即可。例如,
1 2 3 4 2 2 1 8 3 3 1 9 4 3 4 0 5 3 5 6 6 4 5 7 7 4 2 6 8 5 4 3 1 1 2 1 3 3 4 6 5 8 6 9 可以在采用前向星形表示法的基础上,加上上面介绍的rpoint数组和如下的trace数组即可。这相当于一种紧凑的双向星形表示法如下所示:
两种表示法中的弧的对应关系(记为trace) 反向法中弧编号j 1 2 3 4 5 正向法中弧编号trace(j)
对于网络图的表示法,我们作如下说明:
① 星形表示法和邻接表表示法在实际算法实现中都是经常采用的。星形表示法的优点是占用的存储空间较少,并且对那些不提供指针类型的语言(如 FORTRAN语言等)也容易实现。邻接表表示法对那些提供指针类型的语言(如C语言等)是方便的,且增加或删除一条弧所需的计算工作量很少,而这一操作在星形表示法中所需的计算工作量较大(需要花费O(m)的计算时间)。有关“计算时间”的观念是网络优化中需要考虑的一个关键因素。
② 当网络不是简单图,而是具有平行弧(即多重弧)时,显然此时邻接矩阵表示法是不能采用的。其他方法则可以很方便地推广到可以处理平行弧的情形。
③ 上述方法可以很方便地推广到可以处理无向图的情形,但由于无向图中边没有方向,因此可能需要做一些自然的修改。例如,可以在计算机中只存储邻接矩阵的一半信息(如上三角部分),因为此时邻接矩阵是对称矩阵。无向图的关联矩阵只含有元素0和1,而不含有1,因为此时不区分边的起点和终点。又如,在邻接表和星形表示法中,每条边会被存储两次,而且反向星形表示显然是没有必要的,等等。
2.7 轨与连通
4 1 2 5 7 6 8 7 3 8 6 Wv0e1v1e2ekvk,其中eiE(G),1ik,vjV(G),0jk,ei与vi1,vi关联,称W是图G的一条道路(walk),k为路长,顶点v0和vk分别称
为W的起点和终点,而v1,v2,,vk1称为它的内部顶点。
若道路W的边互不相同,则W称为迹(trail)。若道路W的顶点互不相同,则W称为轨(path)。
称一条道路是闭的,如果它有正的长且起点和终点相同。起点和终点重合的轨叫做圈(cycle)。
若图G的两个顶点u,v间存在道路,则称u和v连通(connected)。u,v间的最短轨的长叫做u,v间的距离。记作d(u,v)。若图G的任二顶点均连通,则称G是连通图。
显然有:
(i) 图P是一条轨的充要条件是P是连通的,且有两个一度的顶点,其余顶点
的度为2;
(ii) 图C是一个圈的充要条件是C是各顶点的度均为2的连通图。
§3 应用—最短路问题
3.1 两个指定顶点之间的最短路径
问题如下:给出了一个连接若干个城镇的铁路网络,在这个网络的两个指定城镇间,找一条最短铁路线。
以各城镇为图G的顶点,两城镇间的直通铁路为图G相应两顶点间的边,得图
G。对G的每一边e,赋以一个实数w(e)—直通铁路的长度,称为e的权,得到
赋权图G。G的子图的权是指子图的各边的权和。问题就是求赋权图G中指定的两个顶点u0,v0间的具最小权的轨。这条轨叫做u0,v0间的最短路,它的权叫做u0,v0间的距离,亦记作d(u0,v0)。
求最短路已有成熟的算法:迪克斯特拉(Dijkstra)算法,其基本思想是按距u0从近到远为顺序,依次求得u0到G的各顶点的最短路和距离,直至v0(或直至G的所有顶点),算法结束。为避免重复并保留每一步的计算信息,采用了标号算法。下面是该算法。
(i) 令l(u0)0,对vu0,令l(v),S0{u0},i0。 (ii) 对每个vSi(SiV\\Si),用
min{l(v),l(u)w(uv)}
uSi代替l(v)。计算min{l(v)},把达到这个最小值的一个顶点记为ui1,令
vSiSi1Si{ui1}。
(iii). 若i|V|1,停止;若i|V|1,用i1代替i,转(ii)。
算法结束时,从u0到各顶点v的距离由v的最后一次的标号l(v)给出。在v进入Si之前的标号l(v)叫T标号,v进入Si时的标号l(v)叫P标号。算法就是不断
修改各项点的T标号,直至获得P标号。若在算法运行过程中,将每一顶点获得P标号所由来的边在图上标明,则算法结束时,u0至各项点的最短路也在图上标示出来了。
例9 某公司在六个城市c1,c2,,c6中有分公司,从ci到cj的直接航程票价记在下述矩阵的(i,j)位置上。(表示无直接航路),请帮助该公司设计一张城市c1到其它城市间的票价最便宜的路线图。
05040251040251001520251501020
2010010252010055252555050用矩阵ann(n为顶点个数)存放各边权的邻接矩阵,行向量pb、index1、
index2、d分别用来存放P标号信息、标号顶点顺序、标号顶点索引、最短通路的
值。其中分量
1当第i顶点已标号; pb(i)0当第i顶点未标号index2(i) 存放始点到第i点最短通路中第i顶点前一顶点的序号;
d(i) 存放由始点到第i点最短通路的值。
求第一个城市到其它城市的最短路径的Matlab程序如下: clear; clc;
M=10000;
a(1,:)=[0,50,M,40,25,10];
a(2,:)=[zeros(1,2),15,20,M,25]; a(3,:)=[zeros(1,3),10,20,M]; a(4,:)=[zeros(1,4),10,25]; a(5,:)=[zeros(1,5),55]; a(6,:)=zeros(1,6); a=a+a';
pb(1:length(a))=0;pb(1)=1;index1=1;index2=ones(1,length(a));
d(1:length(a))=M;d(1)=0;temp=1; while sum(pb) index1=[index1,temp]; index=index1(find(d(index1)==d(temp)-a(temp,index1))); if length(index)>=2 index=index(1); end index2(temp)=index; end d, index1, index2 3.2 每对顶点之间的最短路径 计算赋权图中各对顶点之间最短路径,显然可以调用Dijkstra算法。具体方法是:每次以不同的顶点作为起点,用Dijkstra算法求出从该起点到其余顶点的最短路径,反复执行n次这样的操作,就可得到从每一个顶点到其它顶点的最短路径。这种算法的时间复杂度为O(n)。第二种解决这一问题的方法是由Floyd R W提出的算法,称之为Floyd算法。 假设图G权的邻接矩阵为A0, 3a11aA021an1a12a22an2a1na2n ann来存放各边长度,其中: aii0 i1,2,,n; aij i,j之间没有边,在程序中以各边都不可能达到的充分大的数代替; aijwij wij是i,j之间边的长度,i,j1,2,,n。 对于无向图,A0是对称矩阵,aijaji。 Floyd算法的基本思想是:递推产生一个矩阵序列A0,A1,,Ak,,An,其中 Ak(i,j)表示从顶点vi到顶点vj的路径上所经过的顶点序号不大于k的最短路径长 度。 计算时用迭代公式: Ak(i,j)min(Ak1(i,j),Ak1(i,k)Ak1(k,j)) k是迭代次数,i,j,k1,2,,n。 最后,当kn时,An即是各顶点之间的最短通路值。 例10 用Floyd算法求解例1。 矩阵path用来存放每对顶点之间最短路径上所经过的顶点的序号。Floyd算法的Matlab程序如下: clear; clc; M=10000; a(1,:)=[0,50,M,40,25,10]; a(2,:)=[zeros(1,2),15,20,M,25]; a(3,:)=[zeros(1,3),10,20,M]; a(4,:)=[zeros(1,4),10,25]; a(5,:)=[zeros(1,5),55]; a(6,:)=zeros(1,6); b=a+a';path=zeros(length(b)); for k=1:6 for i=1:6 for j=1:6 if b(i,j)>b(i,k)+b(k,j) b(i,j)=b(i,k)+b(k,j); path(i,j)=k; end end end end b, path §4 树 4.1 基本概念 连通的无圈图叫做树,记之为T。若图G满足V(G)V(T),E(T)E(G),则称T是G的生成树。图G连通的充分必要条件为G有生成树。一个连通图的生成树的个数很多,用(G)表示G的生成树的个数,则有公式 公式 (Caylay)(Kn)nn2。 公式 (G)(Ge)(Ge)。 其中Ge表示从G上删除边e,Ge表示把e的长度收缩为零得到的图。 树有下面常用的五个充要条件。 定理1 (i)G是树当且仅当G中任二顶点之间有且仅有一条轨道。 (ii)G是树当且仅当G无圈,且1。 (iii)G是树当且仅当G连通,且1。 (iv)G是树当且仅当G连通,且eE(G),Ge不连通。 (v)G是树当且仅当G无圈,eE(G),Ge恰有一个圈。 4.2 应用—连线问题 欲修筑连接n个城市的铁路,已知i城与j城之间的铁路造价为Cij,设计一个线路图,使总造价最低。 连线问题的数学模型是在连通赋权图上求权最小的生成树。赋权图的具有最小权的生成树叫做最小生成树。 下面介绍构造最小生成树的两种常用算法。 4.2.1 prim算法构造最小生成树 设置两个集合P和Q,其中P用于存放G的最小生成树中的顶点,集合Q存放 G的最小生成树中的边。令集合P的初值为P{v1}(假设构造最小生成树时,从 顶点v1出发),集合Q的初值为Q。prim算法的思想是,从所有pP, vVP的边中,选取具有最小权值的边pv,将顶点v加入集合P中,将边pv加 入集合Q中,如此不断重复,直到PV时,最小生成树构造完毕,这时集合Q中包含了最小生成树的所有边。 prim算法如下: (i)P{v1},Q; (ii)while P~V pvminw(pv,pP,vVP} PP{v} QQ{pv} end 例11 用prim算法求右图的最小生成树。 我们用result3n的第一、二、三行分别表示生成树边的起点、终点、权集合。Matlab程序如下: clc;clear; M=1000; a(1,2)=50; a(1,3)=60; a(2,4)=65; a(2,5)=40; a(3,4)=52;a(3,7)=45; a(4,5)=50; a(4,6)=30;a(4,7)=42; a(5,6)=70; a=[a;zeros(2,7)]; a=a+a';a(find(a==0))=M; result=[];p=1;tb=2:length(a); while length(result)~=length(a)-1 temp=a(p,tb);temp=temp(:); d=min(temp); [jb,kb]=find(a(p,tb)==d); j=p(jb(1));k=tb(kb(1)); result=[result,[j;k;d]];p=[p,k];tb(find(tb==k))=[]; end result 4.2.1 Kruskal算法构造最小生成树 科茹斯克尔(Kruskal)算法是一个好算法。Kruskal算法如下: (i)选e1E(G),使得w(e1)min。 (ii)若e1,e2,,ei已选好,则从E(G){e1,e2,,ei}中选取ei1,使得 ① G[{e1,e2,,ei,ei1}]中无圈,且 ② w(ei1)min。 (iii)直到选得e1为止。 例12 用Kruskal算法构造例3的最小生成树。 我们用index2n存放各边端点的信息,当选中某一边之后,就将此边对应的顶点序号中较大序号u改记为此边的另一序号v,同时把后面边中所有序号为u的改记为v。此方法的几何意义是:将序号u的这个顶点收缩到v顶点,u顶点不复存在。后面继续寻查时,发现某边的两个顶点序号相同时,认为已被收缩掉,失去了被选取的资格。 Matlab程序如下: clc;clear; M=1000; a(1,2)=50; a(1,3)=60; a(2,4)=65; a(2,5)=40; a(3,4)=52;a(3,7)=45; a(4,5)=50; a(4,6)=30;a(4,7)=42; a(5,6)=70; [i,j]=find((a~=0)&(a~=M)); b=a(find((a~=0)&(a~=M))); data=[i';j';b'];index=data(1:2,:); loop=max(size(a))-1; result=[]; while length(result) v1=data(1,flag);v2=data(2,flag); if index(1,flag)~=index(2,flag) result=[result,data(:,flag)]; end if v1>v2 index(find(index==v1))=v2; else index(find(index==v2))=v1; end data(:,flag)=[]; index(:,flag)=[]; end result §5 匹配问题 定义 若ME(G),ei,ejM,ei与ej无公共端点(ij),则称M为图G的一个对集;M中的一条边的两个端点叫做在对集M中相配;M中的端点称为被M许配;G中每个顶点皆被M许配时,M称为完美对集;G中已无使 |M'||M|的对集M',则M称为最大对集;若G中有一轨,其边交替地在对集M内外出现,则称此轨为M的交错轨,交错轨的起止顶点都未被许配时,此交错轨称为可增广轨。 若把可增广轨上在M外的边纳入对集,把M内的边从对集中删除,则被许配的顶点数增加2,对集中的“对儿”增加一个。 1957年,贝尔热(Berge)得到最大对集的充要条件: 定理2 M是图G中的最大对集当且仅当G中无M可增广轨。 1935年,霍尔(Hall)得到下面的许配定理: 定理3 G为二分图,X与Y是顶点集的划分,G中存在把X中顶点皆许配的对集的充要条件是,SX,则|N(S)||S|,其中N(S)是S中顶点的邻集。 由上述定理可以得出: 推论1:若G是k(k0)正则2分图,则G有完美对集。 所谓k正则图,即每顶点皆k度的图。 由此推论得出下面的婚配定理: 定理4 每个姑娘都结识k(k1)位小伙子,每个小伙子都结识k位姑娘,则每位姑娘都能和她认识的一个小伙子结婚,并且每位小伙子也能和他认识的一个姑娘结婚。 人员分派问题等实际问题可以化成对集来解决。 人员分派问题:工作人员x1,x2,,xn去做n件工作y1,y2,,yn,每人适合做其中一件或几件,问能否每人都有一份适合的工作?如果不能,最多几人可以有 适合的工作? 这个问题的数学模型是:G是二分图,顶点集划分为V(G)XY, X1{x1,,xn},Y1{y1,,yn},当且仅当xi适合做工作yi时,xiyiE(G), 求G中的最大对集。 解决这个问题可以利用1965年埃德门兹(Edmonds)提出的匈牙利算法。 匈牙利算法: (i)从G中任意取定一个初始对集M。 (ii)若M把X中的顶点皆许配,停止,M即完美对集;否则取X中未被M许配的一顶点u,记S{u},T。 (iii)若N(S)T,停止,无完美对集;否则取yN(S)T。 (iv)若y是被M许配的,设yzM,SS{z},TT{y},转(iii);否则,取可增广轨P(u,y),令M(ME(P))(E(P)M),转(ii)。 把以上算法稍加修改就能够用来求二分图的最大对集。 最优分派问题:在人员分派问题中,工作人员适合做的各项工作当中,效益未必一致,我们需要制定一个分派方案,使公司总效益最大。 这个问题的数学模型是:在人员分派问题的模型中,图G的每边加了权 w(xiyj)0,表示xi干yj工作的效益,求加权图G上的权最大的完美对集。 解决这个问题可以用库恩—曼克莱斯(Kuhn-Munkres)算法。为此,我们要引入可行顶点标号与相等子图的概念。 定义 若映射l:V(G)R,满足xX,yY, l(x)l(y)w(x,y), 则称l是二分图G的可行顶点标号。令 El{xy|xyE(G),l(x)l(y)w(xy)}, 称以El为边集的G的生成子图为相等子图,记作Gl。 可行顶点标号是存在的。例如 l(x)maxw(xy),yYxX; l(y)0, yY。 定理5 Gl的完美对集即为G的权最大的完美对集。 Kuhn-Munkres算法 (i)选定初始可行顶点标号l,确定Gl,在Gl中选取一个对集M。 (ii)若X中顶点皆被M许配,停止,M即G的权最大的完美对集;否则,取Gl中未被M许配的顶点u,令S{u}, T。 (iii)若NGl(S)T,转(iv);若NGl(S)T,取 lmin{l(x)l(y)w(xy)}, xS,yTl(v)l,vS l(v)l(v)l,vT, l(v),其它 ll ,GlGl。 (iv)选NGl(S)T中一顶点y,若y已被M许配,且yxM,则 SS{z},TT{y},转(iii);否则,取Gl中一个M可增广轨P(u,y), 令 M(ME(P))(E(P)M), 转(ii)。 其中NGl(S)是Gl中S的相邻顶点集。 例 已知利用5种不同产品作5种不同用途的效益矩阵为 x13x22Cx34x48x57y1601435520615, 23644256y2y3y4y5求最佳匹配使总的效益最高。 用x1,x2,x3,x4,x5表示5种产品,y1,y2,y3,y4,y5表示5种用途,可得 一个完全二部图K5,5。利用标号法求最佳匹配的步骤如下: ( 1 ) 给 予 初 始 标 号 : l(x1)6,l(x2)5,l(x3)6,l(x4)8,l(x5)7,l(y1)l(y2)l(y3)l(y4)l(y5)0。 (2)在给定的标号下求得的等性子集 Elx1y2,x2y3,x2y4,x3y3,x4y1,x5y1。构造G(El),如图4-2-6.4所示。 (3)在G(El)中求得最大匹配Mx1y2,x2y4,x3y3,x4y1。 (4)x5未饱和,Sx5,T,N(S)y1;选y1,因为x4y1M,重新构造Sx4,x5,Ty1,这时N(S)T,必须修改原标号。 (5)求得l(x1)6,l(x2)5,i4,5;2j5minl(x)l(yij)w(xiyj)1,新的标号是 l(x3)6,l(x4)7,l(x5)6,l(y1)1,l(y2)l(y3)l(y4)l(y5)0。 (6)在新标号下求得等性子集 Ejx1y2,x2y3,x2y4,x3y3,x4y1,x5y1,x5y5,并构造G(El),如图4-2-6.5 所示。 (7)求得G(El)的一个最大匹配Mx1y2,x2y4,x3y3,x4y1,x5y5,它使X部的所有结点都饱和,因此是最佳匹配。由这个最佳匹配得到的总效益为 W(M)=6+5+6+8+6=31。 x1 x2 x3 x4 y4 x5 图4-2-6.4 y1 y2 y3 x4 x5 图4-2-6.5 y4 y5 x1 x2 x3 y1 y2 y3 §6 Euler图和Hamilton图 6.1 基本概念 定义 经过G的每条边的迹叫做G的Euler迹;闭的Euler迹叫做Euler回路或E回路;含Euler回路的图叫做Euler图。 直观地讲,Euler图就是从一顶点出发每边恰通过一次能回到出发点的那种图,即不重复地行遍所有的边再回到出发点。 定理7 (i)G是Euler图的充分必要条件是G连通且每顶点皆偶次。 (ii)G是Euler图的充分必要条件是G连通且GCi1di,Ci是圈, E(Ci)E(Cj)(ij)。 (iii)G中有Euler迹的充要条件是G连通且至多有两个奇次点。 定义 包含G的每个顶点的轨叫做Hamilton(哈密顿)轨;闭的Hamilton轨叫做Hamilton圈或H圈;含Hamilton圈的图叫做Hamilton图。 直观地讲,Hamilton图就是从一顶点出发每顶点恰通过一次能回到出发点的那种图,即不重复地行遍所有的顶点再回到出发点。 6.2 Euler回路的Fleury算法 1921年,Fleury给出下面的求Euler回路的算法。 Fleury算法: 1o. v0V(G),令W0v0。 2o. 假设迹Wiv0e1v1eivi已经选定,那么按下述方法从E{e1,,ei}中选取边ei1: (i)ei1和vi相关联; (ii)除非没有别的边可选择,否则ei1不是GiG{e1,,ei}的割边(cut edge)。(所谓割边是一条删除后使连通图不再连通的边)。 3o. 当第2步不能再执行时,算法停止。 6.3 应用 6.3.1 邮递员问题 中国邮递员问题 一位邮递员从邮局选好邮件去投递,然后返回邮局,当然他必须经过他负责投递的每条街道至少一次,为他设计一条投递路线,使得他行程最短。 上述中国邮递员问题的数学模型是:在一个赋权连通图上求一个含所有边的回路,且使此回路的权最小。 显然,若此连通赋权图是Euler图,则可用Fleury算法求Euler回路,此回路即为所求。 对于非Euler图,1973年,Edmonds和Johnson给出下面的解法: 设G是连通赋权图。 (i)求V0{v|vV(G),d(v)1(mod2)}。 (ii)对每对顶点u,vV0,求d(u,v)(d(u,v)是u与v的距离,可用Floyd算法求得)。 (iii)构造完全赋权图K|V0|,以V0为顶点集,以d(u,v)为边uv的权。 (iv)求K|V0|中权之和最小的完美对集M。 (v)求M中边的端点之间的在G中的最短轨。 (vi)在(v)中求得的每条最短轨上每条边添加一条等权的所谓“倍边”(即共端点共权的边)。 (vii)在(vi)中得的图G'上求Euler回路即为中国邮递员问题的解。 多邮递员问题: 邮局有k(k2)位投递员,同时投递信件,全城街道都要投递,完成任务返回邮局,如何分配投递路线,使得完成投递任务的时间最早?我们把这一问题记成kPP。 kPP的数学模型如下: G(V,E)是连通图,v0V(G),求G的回路C1,,Ck,使得 (i)v0V(Ci),i1,2,,k, (ii)max1ikkeE(Ci)w(e)min, i(iii) E(C)E(G) i16.3.2 旅行商(TSP)问题 一名推销员准备前往若干城市推销产品,然后回到他的出发地。如何为他设计一条最短的旅行路线(从驻地出发,经过每个城市恰好一次,最后返回驻地)?这 个问题称为旅行商问题。用图论的术语说,就是在一个赋权完全图中,找出一个有最小权的Hamilton圈。称这种圈为最优圈。与最短路问题及连线问题相反,目前还没有求解旅行商问题的有效算法。所以希望有一个方法以获得相当好(但不一定最优)的解。 一个可行的办法是首先求一个Hamilton圈C,然后适当修改C以得到具有较小权的另一个Hamilton圈。修改的方法叫做改良圈算法。设初始圈Cv1v2vnv1。 (i)对于1i1jn,构造新的Hamilton圈: Cijv1v2vivjvj1vj2vi1vj1vj2vnv1, 它是由C中删去边vivi1和vjvj1,添加边vivj和vi1vj1而得到的。若则以Cij代替C,Cij叫做C的改良w(vivj)w(vi1vj1)w(vivi1)w(vjvj1), 圈。 (ii)转(i),直至无法改进,停止。 用改良圈算法得到的结果几乎可以肯定不是最优的。为了得到更高的精确度,可以选择不同的初始圈,重复进行几次算法,以求得较精确的结果。 这个算法的优劣程度有时能用Kruskal算法加以说明。假设C是G中的最优圈。则对于任何顶点v,Cv是在Gv中的Hamilton轨,因而也是Gv的生成树。由此推知:若T是Gv中的最优树,同时e和f是和v关联的两条边,并使得 w(e)w(f)尽可能小,则w(T)w(e)w(f)将是w(C)的一个下界。 这里介绍的方法已被进一步发展。圈的修改过程一次替换三条边比一次仅替换两条边更为有效;然而,有点奇怪的是,进一步推广这一想法,就不利了。 例13 从北京(Pe)乘飞机到东京(T)、纽约(N)、墨西哥城(M)、伦敦(L)、巴黎(Pa)五城市做旅游,每城市恰去一次再回北京,应如何安排旅游线,使旅程最短?各城市之间的航线距离如下表: L M N Pa Pe T L 56 35 21 51 60 M 56 21 57 78 70 N 35 21 36 68 68 Pa 21 57 36 51 61 Pe 51 78 68 51 13 T 60 70 68 61 13 解:编写程序如下: clc,clear a(1,2)=56;a(1,3)=35;a(1,4)=21;a(1,5)=51;a(1,6)=60; a(2,3)=21;a(2,4)=57;a(2,5)=78;a(2,6)=70; a(3,4)=36;a(3,5)=68;a(3,6)=68; a(4,5)=51;a(4,6)=61; a(5,6)=13; a(6,:)=0; a=a+a'; c1=[5 1:4 6]; L=length(c1); flag=1; while flag>0 flag=0; for m=1:L-3 for n=m+2:L-1 if