数据结构基础19———非线性数据结构之图

图论 (Graph theory) 是数学的一个分支,图是图论的主要研究对象。 图 (Graph) 是由若干给定的顶点及连接两顶点的边所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系。顶点用于代表事物,连接两顶点的边则用于表示两个事物间具有这种关系。

官方定义:
图 (Graph) 是一个二元组(V,E) ,其中V 和 E为集合(多重集)。图常用G, H等表示,如 G = (V,E) 。

图分为 无向图 (Undirected graph) 和 有向图 (Directed graph) 两种,若G为无向图,则E中的每个元素为一个无序二元组(u,v),称作无向边(Undirected edge) ,简称 边 (Edge) ,其中u,v∈V 。设 e=(u,v) ,则u和v称为e的端点 (Endpoint) 。

若G为有向图,则E中的每一个元素为一个有序二元组(u,v),有时也写作u→v ,称作有向边 (Directed edge) 或 弧 (Arc) ,在不引起混淆的情况下也可以称作 边 (Edge) 。设e = u → v,则此时u称为e的 起点 (Tail),v称为e的终点 (Head) ,起点和终点也称为e的端点 (Endpoint) 。

对于V中的每个元素,我们称其为 顶点 (Vertex) 或 节点 (Node) ,简称 点 ,顶点的集合称为 点集 (Vertex set) ,边的集合称为 边集 (Edge set) 。

图G的点集和边集可以表示为V(G) 和E(G) ,在不引起混淆的情况下,也能表示成V和E。图G的点数|V(G)|也被称作图 的 阶 (Order) 。


--- 形象地说,图是由若干点以及连接点与点的边构成的结构(各个数据节点之间多对多)。

我们知道,树中的元素我们称为节点,图中的元素我们就叫作顶点(vertex)。从我画的图中可以看出来,图中的一个顶点可以与任意其他顶点建立连接关系。我们把这种建立的关系叫作边(edge)。

我们就拿微信举例子吧。我们可以把每个用户看作一个顶点。如果两个用户之间互加好友,那就在两者之间建立一条边。所以,整个微信的好友关系就可以用一张图来表示。其中,每个用户有多少个好友,对应到图中,就叫作顶点的度(degree),就是跟顶点相连接的边的条数。

实际上,微博的社交关系跟微信还有点不一样,或者说更加复杂一点。微博允许单向关注,也就是说,用户 A 关注了用户 B,但用户 B 可以不关注用户 A。那我们如何用图来表示这种单向的社交关系呢?

我们可以把刚刚讲的图结构稍微改造一下,引入边的“方向”的概念。如果用户 A 关注了用户 B,我们就在图中画一条从 A 到 B 的带箭头的边,来表示边的方向。如果用户 A 和用户 B 互相关注了,那我们就画一条从 A 指向 B 的边,再画一条从 B 指向 A 的边。

我们把这种边有方向的图叫作“有向图”。以此类推,我们把边没有方向的图就叫作“无向图”。

image.png

我们刚刚讲过,无向图中有“度”这个概念,表示一个顶点有多少条边。在有向图中,我们把度分为入度(In-degree)和出度(Out-degree)。

顶点的入度,表示有多少条边指向这个顶点;顶点的出度,表示有多少条边是以这个顶点为起点指向其他顶点。对应到微博的例子,入度就表示有多少粉丝,出度就表示关注了多少人。

前面讲到了微信、微博、无向图、有向图,现在我们再来看另一种社交软件:QQ。QQ 中的社交关系要更复杂的一点。不知道你有没有留意过 QQ 亲密度这样一个功能。QQ 不仅记录了用户之间的好友关系,还记录了两个用户之间的亲密度,如果两个用户经常往来,那亲密度就比较高;如果不经常往来,亲密度就比较低。如何在图中记录这种好友关系的亲密度呢?

这里就要用到另一种图,带权图(weighted graph)。在带权图中,每条边都有一个权重(weight),我们可以通过这个权重来表示 QQ 好友间的亲密度

image.png

邻接矩阵存储方法

图最直观的一种存储方法就是,邻接矩阵(Adjacency Matrix)。邻接矩阵的底层依赖一个二维数组。

对于无向图来说,如果顶点 i 与顶点 j 之间有边,我们就将 A[i][j]和 A[j][i]标记为 1;

对于有向图来说,如果顶点 i 到顶点 j 之间,有一条箭头从顶点 i 指向顶点 j 的边,那我们就将 A[i][j]标记为 1。

同理,如果有一条箭头从顶点 j 指向顶点 i 的边,我们就将 A[j][i]标记为 1。对于带权图,数组中就存储相应的权重。
image.png

用邻接矩阵来表示一个图,虽然简单、直观,但是比较浪费存储空间。为什么这么说呢?对于无向图来说,如果 A[i][j]等于 1,那 A[j][i]也肯定等于 1。实际上,我们只需要存储一个就可以了。也就是说,无向图的二维数组中,如果我们将其用对角线划分为上下两部分,那我们只需要利用上面或者下面这样一半的空间就足够了,另外一半白白浪费掉了。

还有,如果我们存储的是稀疏图(Sparse Matrix),也就是说,顶点很多,但每个顶点的边并不多,那邻接矩阵的存储方法就更加浪费空间了。比如微信有好几亿的用户,对应到图上就是好几亿的顶点。但是每个用户的好友并不会很多,一般也就三五百个而已。如果我们用邻接矩阵来存储,那绝大部分的存储空间都被浪费了。

但这也并不是说,邻接矩阵的存储方法就完全没有优点。首先,邻接矩阵的存储方式简单、直接,因为基于数组,所以在获取两个顶点的关系时,就非常高效。其次,用邻接矩阵存储图的另外一个好处是方便计算。这是因为,用邻接矩阵的方式存储图,可以将很多图的运算转换成矩阵之间的运算。比如求解最短路径问题时会提到一个Floyd-Warshall 算法,就是利用矩阵循环相乘若干次得到结果。

邻接表存储方法

针对上面邻接矩阵比较浪费内存空间的问题,我们来看另外一种图的存储方法,邻接表(Adjacency List)。

我画了一张邻接表的图,你可以先看下。乍一看,邻接表是不是有点像散列表?每个顶点对应一条链表,链表中存储的是与这个顶点相连接的其他顶点。另外我需要说明一下,图中画的是一个有向图的邻接表存储方式,每个顶点对应的链表里面,存储的是指向的顶点。对于无向图来说,也是类似的,不过,每个顶点的链表中存储的,是跟这个顶点有边相连的顶点,你可以自己画下。

image.png

邻接矩阵存储起来比较浪费空间,但是使用起来比较节省时间。相反,邻接表存储起来比较节省空间,但是使用起来就比较耗时间。

就像图中的例子,如果我们要确定,是否存在一条从顶点 2 到顶点 4 的边,那我们就要遍历顶点 2 对应的那条链表,看链表中是否存在顶点 4。而且,我们前面也讲过,链表的存储方式对缓存不友好。所以,比起邻接矩阵的存储方式,在邻接表中查询两个顶点之间的关系就没那么高效了。

在在基于链表法解决冲突的散列表中,如果链过长,为了提高查找效率,我们可以将链表换成其他更加高效的数据结构,比如平衡二叉查找树等。我们刚刚也讲到,邻接表长得很像散列。所以,我们也可以将邻接表同散列表一样进行“改进升级”。我们可以将邻接表中的链表改成平衡二叉查找树。

实际开发中,我们可以选择用红黑树。这样,我们就可以更加快速地查找两个顶点之间是否存在边了。当然,这里的二叉查找树可以换成其他动态数据结构,比如跳表、散列表等。除此之外,我们还可以将链表改成有序动态数组,可以通过二分查找的方法来快速定位两个顶点之间否是存在边。

/**
 * 
 * 图的基本实现:邻接表
 * 
 *就是用二维数组或者邻接表之类的表达一堆顶点之间的关系,好像没啥代码需要写的
 * @author yixunfei
 *
 */
public class Graph {


	/*
	 * 邻接表存储 和散列表类似,每个顶点内保存一个其指向的顶点的链表。 缺点:每次查找一个顶点和另一个顶点是否有连续都要遍历一次顶点内的所有路径。
	 * 速度没有数组快 好处:省内存 优化:参考散列表,如果链过长,把顶点内的链表转换为红黑树,跳表,散列甚至有序数组之类的。
	 * 
	 */
	private int nodeNum; // 顶点的个数
	private LinkedList<Integer> graphNodeMap[]; // 邻接表

	public Graph(int nodeNum) {
		this.nodeNum = nodeNum;
		graphNodeMap = new LinkedList[nodeNum];
		for (int i = 0; i < nodeNum; ++i) {
			graphNodeMap[i] = new LinkedList<>();
		}
	}

	public void addEdge(int start, int target) { // 无向图一条边存两次
		graphNodeMap[start].add(target);
		graphNodeMap[target].add(start);
	}

	public int getNodeNum() {
		return nodeNum;
	}

	public void setNodeNum(int nodeNum) {
		this.nodeNum = nodeNum;
	}

	public LinkedList<Integer>[] getGraphNodeMap() {
		return graphNodeMap;
	}

	public void setGraphNodeMap(LinkedList<Integer>[] graphNodeMap) {
		this.graphNodeMap = graphNodeMap;
	}

	
	
	//===========================邻接表图优化
	//当顶点关联关系过多导致链表性能下降(链表遍历查找)时,转换为散列表或者红黑树或者动态有序数组
//	private final capS;//装载因子,扩容标准和阀值
	//详细见散列表和跳表,红黑树的实现,复制过来就可以了。略
	
	
}


/**
 *  图的基本实现:邻接矩阵
 * @author yixunfei
 *
 */
public class GraphByArray {

	/*
	 * 邻接矩阵 如果顶点i到j之间有连接的边,就设置arr[i][j] = 1
	 * ,如果是加权图arr[i][j]就是权重,如果是有向图则[i][j]和[j][i]表示谁指向谁.
	 * 缺点:对于无向图浪费了一半的空间,如果比较疏的话(点多但是关联少,比如:15亿人,彼此认识的人的图.15亿-15亿,然而彼此认识的没几个),浪费非常严重
	 * 好处:简单,直接计算矩阵方便,数组速度快
	 */
	private int[][] graphArr;
	
	private int maxCap;
	
	//是否是有向图
	private boolean directedFlag;

	//是否是加权图
	private boolean weightFlag;
	
	/**
	 * 
	 * @param nodeCap
	 * @param directedFlag 可选参数
	 * @param weightFlag 可选参数
	 */
	public GraphByArray(int nodeCap,Optional<Boolean> directedFlag,Optional<Boolean> weightFlag) {
		this.maxCap = nodeCap;
		this.graphArr = new int[nodeCap][nodeCap];
		this.directedFlag = directedFlag.orElse(false);
		this.weightFlag = weightFlag.orElse(false);
	}

	/**
	 * 
	 * @param start
	 * @param target
	 * @param weightOptional 可选参数
	 * @return
	 */
	public int addEdge(int start,int target,Optional<Integer> weightOptional) {
		if(Math.max(maxCap, Math.max(start, target)) != maxCap) {
			//超过范围,数组会自己抛出下标越界,懒得管
		}
		//如果是加权图,这里就是权值,否则就是可以去掉weight直接赋值为1
		int weight = weightOptional.orElse(1);
		graphArr[start][target] = weight;
		//如果是无向图就要加两个,否则只加一个
		if(this.directedFlag) {
			graphArr[target][start] = weight;			
		}
		return target;
	}
	
	
}

图的遍历——广度优先BFS

先检查所有直接相互连接的点(类似树的子节点,层次遍历),没有再回去检测下下级连接的节点。(水平同一级找完在到下一层纵向所以叫广度优先)

如:要在找张三的联系方式,先把自己的通讯录找一遍有没有张三,找去问通讯录里面的人知不知道张三的连续方式,递归。

/**
 * 广度优先搜索BFS
 * 先检测直接连接的完了,没有再回去检测下下级连接的
 * O(边数)
 * O(顶点数)
 * @author yixunfei
 *
 */
public class BreadthFirstSearch {

	public void search(Graph graph, int startNode, int targetNode) {
		if (startNode == targetNode) {
			return;
		}
		int nodeNum = graph.getNodeNum();
		// 记录顶点是否访问过
		boolean[] visited = new boolean[graph.getNodeNum()];
		visited[startNode] = true;

		// 记录已经访问但是没有查找该顶点内的连接的顶点的顶点
		Queue<Integer> queue = new LinkedList<>();
		queue.add(startNode);

		// 用于记录搜索路径的数组
		int[] prev = new int[nodeNum];
		for (int i = 0; i < nodeNum; ++i) {
			prev[i] = -1;
		}

		LinkedList<Integer>[] nodeMap = graph.getGraphNodeMap();

		while (queue.size() != 0) {
			int nodeNow = queue.poll();
			// 遍历顶点内的连接信息
			for (int i = 0; i < nodeMap[nodeNow].size(); ++i) {
				int nextNode = nodeMap[nodeNow].get(i);
				if (!visited[nextNode]) {
					prev[nextNode] = nodeNow;
					if (nextNode == targetNode) {
						print(prev, startNode, targetNode);
						return;
					}
					visited[nextNode] = true;
					// 加入到连接的顶点队列,以下一个顶点为开始继续搜索
					queue.add(nextNode);
				}
			}
		}
	}

	private void print(int[] prev, int start, int target) {
		if (prev[target] != -1 && target != start) {
			print(prev, start, prev[target]);
		}
		System.out.print(target + " ");
	}

}

图的遍历——深度优先DFS

先检查一条线走到底,没有在回到上一个继续找

如:要在找张三的联系方式,先把自己的通讯录的每一个人问一遍有没有张三联系方式,没有再切换到下一个人。

/**
 * DFS 深度优先搜索
 * 就是一条路走到底不通再回去下一条.回溯
 * 
 * @author yixunfei
 *
 */
public class DepthFirstSearch {

	//用于终止递归其他节点的路径查找,如1-2-3-4 ,1-5-4如果从2顶点一直向下找到了4,就没必要回到5再找了.
	private boolean found = false;

	public void search(Graph graph, int start, int target) {
		found = false;
		int nodeCount = graph.getNodeNum();
		LinkedList<Integer>[] nodeMap = graph.getGraphNodeMap();
		//记录已经访问过的顶点
		boolean[] visited = new boolean[nodeCount];
		//记录路径的数组
		int[] prev = new int[nodeCount];
		for (int i = 0; i < nodeCount; ++i) {
			prev[i] = -1;
		}
		recurSearch(nodeMap, start, target, visited, prev);
		print(prev, start, target);
	}

	private void recurSearch(LinkedList<Integer>[] nodeMap, int start, int target, boolean[] visited, int[] prev) {
		if (found == true) {
			return;
		}
		visited[start] = true;
		if (start == target) {
			found = true;
			return;
		}
		//将一个顶点到另一个顶点一直找到底,没有再回到另一个顶点
		for (int i = 0; i < nodeMap[start].size(); ++i) {
			int nextNode = nodeMap[start].get(i);
			if (!visited[nextNode]) {
				prev[nextNode] = start;
				recurSearch(nodeMap, nextNode, target, visited, prev);
			}
		}
	}

	private void print(int[] prev, int start, int target) {
		if (prev[target] != -1 && target != start) {
			print(prev, start, prev[target]);
		}
		System.out.print(target + " ");
	}
	
	public static void main(String[] args) {
		Graph graph = new Graph(10);
		for(int i = 0;i < 8; i++) {
			graph.addEdge(i, i+1);
			graph.addEdge(i, i+2);
		}
		new DepthFirstSearch().search(graph,3, 9);
	}

}

其他:欧拉图,二分图,哈密顿图,网络流,拓扑排序等略。

更新时间:2020-02-13 17:33:51

本文由 寻非 创作,如果您觉得本文不错,请随意赞赏
采用 知识共享署名4.0 国际许可协议进行许可
本站文章除注明转载/出处外,均为本站原创或翻译,转载前请务必署名
原文链接:https://www.zhouning.group/archives/数据结构基础19非线性数据结构之图
最后更新:2020-02-13 17:33:51

评论

Your browser is out of date!

Update your browser to view this website correctly. Update my browser now

×