分布式数据库查询优化算法的研究
2023-12-23
来源:星星旅游
科技・搽索・争鸣 Sc科ience&Te技ch视nology界 Vision 分布式数据库查询优化算法的研究 吴军张琳 (遵义师范学院信息工程学院。贵州遵义563000) 【摘要】由于分布式数据库需要在网络上传输数据,因而数据查询比较复杂,高效地查询是分布式数据库研究的热门问题。本文首先介绍 了什么是分布式数据库,随后介绍了分布式数据库中查询优化的若干知识,最后总结了目前5种主流的查询优化策略。 【关键词】分布式数据库;查询优化;算法 1 分布式数据库概述 2)Hash划分算法:首先选取一个合适的Hash函数.然后对某一 分布数据库是指数据分存在计算机网络中的各台计算机上的数 个属性或几个属性集合进行Hash操作.根据Hash操作的结果将关系 据库,该数据库具备物理分散性和逻辑上集中性特征.可以将其看作 放置于相应的站点上,这样就能够得到相应关系的水平片段 计算机网络和 据库系统相结合的数据库系统。 3)Partition算法:在多个关系中.如果可以将同一连接属性进行 有效的片段划分.便可以通过并行运行来降低响应时间 。 2查询优化概述 3.4基于查询图的优化算法 这类算法的基本思想是构造出代价模型的查询图.并利用贪心算 查询优化是数据库研究领域中一个热点问题 分布式查询处理问 题最初是由E—Wong提出来的,其实质是通过数据分析和数据交互.将 法实现数据库查询的方法 。该算法有两种改进算法: 1)CHAIN算法:对于可以将查询转换为链形结构的查询图中.该 分布式查询这一问题转化为局部的数据条目查询 全局查询的定义是使用者通过使用全局查询评议.能够对多个物 算法能够找到最少的连接代价序列.从而便能够降低查询代价 理上分散的数据库同时进行有效查询的一种查询方式 分布式数据库 2)Kruskal算法:对于不同查询图.该算法都需要找到查询图中最 少连接代价的序列。也就是说在分布式数据库中.找出查询图最少连 的查询优化主要从两个方面来着手.一方面是降低查询总代价.另一 方面是缩短响应时间 接代价 1)总代价:与CPU代价、I/0代价和通信代价。 3.5基于粒子群算法 2)响应时间:主要和通信时间以及局部处理时间有关。 以多表连接查询的特征为基础,对粒子进行树形编码的一种分布 式数据查询方式 使用粒子群算法优化后的查询策略比原始查询策略 3五种查询优化算法 的查询执行代价低,有效地增加了系统的查询效率。为了进一步提升 3.1基于关系代数等价优化算法 效率,文献『7]又提出了多连接粒子群优化算法,该算法能够被正确应 该类方法的基本思想是将查询问题等价转变为关系代数表达式. 用于更为复杂的多连接查询优化问题中 然后根据关系代数表达式生成相应的查询语法树 通过分析上述语法 4结论 树的特点.可以利用相应的等价规则来进行优化查询_1 _3-2基于半连接操作的优化算法 在分布式数据库中,查询优化是一个热门研究问题。本文针对该 连接操作是分布式数据库中经常使用的操作.该操作时间代价很 问题综述了五种优化策略。虽然国内外学者在优化算法做出了大量的 高。在一些算法中.通过正确使用半连接操作。可以大量减少与连接操 工作.但是这些优化策略都存在一定的局限性.还需要新的算法和策 作不相关的数据的传输.这些算法被统称为基于半连接操作的优化算 略来进一步提升查询优化的效率。e 法。代表算法有: 1)sDD一1算法口I:通过迭代得到有益半连接运算。能够大量减少 【参考文献】 每个站点的运算操作数量.最后将所有站点得到的数据进行整合就能 [1]邵佩英.分布式数据库系统及其应用[M1.2版.北京:科学出版社,2005. 获取最终的查询结果 [2]聂林娣.分布式数据库查询优化策略研究『J1.电脑知识与技术:学术交流,2006 2)WPERF+竹法Ki:通过减少网络流量来优化查询,但必须保证结 (6):5-6. 果的正确件 [3]冯祖洪,徐宗本.WPERF+:一种有效的分布式查询处理优化算法Ⅱ1.工程数学 3)二分劈开缩减算法 l:通过正确的使用二分劈开条件.可以将完 学报,2004,21(5):797—802. 『4]魏士伟,黄文明,康业娜,周娅.分布式数据库中基于半连接的查询优化算法 全半连接中的缩减关系分成两部分 随之.把具有相同条件的数据传 研究_J1.计算机应用,2007,27(S1):34—36. 递到一个相同的站点进行相应的链接操作即可 [5]于秀霞,赵建平 分布式数据库直接连接查询优化算法的研究【J1.长春理工大 3-3基于直连接操作的优化算法 学学报f自然科学版1.2005,28(3):55—57 直接连接操作相对于半连接操作而言更为重视局部处理代价,却 f6]尤沛泉.基于查询图的分布式数据库查询优化算法的研究与应用fD1 长春理 较少考虑传输代价[51。该策略的代表算法有: 工大学,201 1. 1)分片复制算法:首先将查询中的某一个关系进行分片.随之将 [7]陈一栋.分布式数据库查询优化算法研究与实现[D】.长沙理工大学,2008. 所有的片段都传递到一组预定的站点中.这些站点可以独立的处理该 关系的连接操作.最终结果即是每个预定站点返回结果的集合 [责任编辑:田吉捷] (上接第194页)物产生影响。 出版社.1981:57—82. 3)在采空区上方进行工程建设时.根据实际情况采取压力灌溉地 f4]国家煤炭工业局.建筑物、水体、铁路及主要井巷煤柱留设与压煤开采规程 基处理措施、建筑物抗变形结构技术措施及禁采措施.确保建筑场地 fM].北京:煤炭工业出版社,2000:226—229. 受采空区的影响达到最小。e 『5]张俊英,王金庄.采空区地表新建建筑地基稳定性评价技术研究f J1l矿山测 量.2003,9(3):28—31. 【参考文献】 [6]康建荣,王金庄,温泽民.任意形多工作面多线段开采沉陷预计系统(MSPS)l J1. [1]郭惟嘉,王勇义.采空区上方修建大型建筑物地基稳定性评价叨.岩土力学, 矿山测量 2000,l:24—27. 2004,25(增刊):57—59. [7]GB50021—2001岩土工程勘察规范『S]. [2]腾永海,张俊英.老采空区地基稳定性评价田煤炭学报,1997,22(5):504-508. [8]GB50007—201 1建筑地基基础设计规范fs1. [3]华南工学院,南京工学院,浙江大学,等地基及基础[M】.北京:中国建筑工业 [责任编辑:田吉捷] 1 52 l科技视界Science&Technology Vision l I