一、基本概念
查找表
由同一类型的数据元素(或记录)构成的集合。
查 找
查询(Searching)特定元素是否在表中。
静态查找
只查找,不改变集合内的数据元素。
动态查找
既查找,又改变(增减)集合内的数据元素。
关键字
记录中某个数据项的值,可用来识别一个记录
主关键字
可以唯一标识一个记录的关键字
次关键字
识别若干记录的关键字
平均查找长度(average search length , ASL)
是为确定数据元素在查找表中的位置,需要和给定的值进行比较的关键字个数的期望值,称为查找算法在查找成功时的平均查找长度。
二、静态查找
2.1、顺序查找-------线性查找
顺序查找:即用逐一比较的办法顺序查找关键字,这显然是最直接的办法。
public class OrderSearch { public static int ordersearch(int[] arry, int des) { for (int i = 0; i < arry.length; i++) { if (des == arry[i]) return i; } return -1; } public static void main(String[] args) { int[] a = new int[] { 2, 6, 5, 6, 7, 3, }; System.out.println(ordersearch(a, 3)); }}
技巧:把待查关键字key存入表头或表尾(俗称“哨兵”),这样可以加快执行速度。
算法的基本思想是:在查找表的一端设置一个称为“监视哨”的附加单元,存放要查找的数据元素关键字,其目的在于免去查找过程中每一步都检测整个表是否查找完毕。然后从表的另一端开始查找,如果在“监视哨”位置找到给定关键字,则失败,否则成功返回相应元素的位置。
ASL== (1+ 2 + … + n)/n = (n+1)/2=(1+n)/2 ,时间效率为 O(n)
优点:算法简单,且对顺序结构或链表结构均适用。
缺点: ASL 太长,时间效率太低。
2.2、折半查找--------二分查找
折半查找又称为二分查找,这种查找方法需要待查的查找表满足两个条件:首先,查找表必须使用顺序的存储结构(树结构可借助二叉排序树来查找,属动态查找表形式);其次,查找表必须按关键字大小有序排列。
算法的基本思想是:首先,将查找表中间位置数据元素的关键字与给定关键字比较,如果相等则查找成功;否则利用中间元素将表一分为二,如果中间元素关键字大于给定关键字,则在前一子表中进行折半查找,否则在后一子表中进行折半查找。重复以上过程,直到找到满足条件的元素,则查找成功;或直到子表为空为止,即查找范围的上界≤下界时停止查找,此时查找不成功。
例子:
(05 13 19 21 37 56 64 75 80 88 92)
① 先设定3个辅助标志: low指向待查元素所在区间的下界,high指向待查元素所在区间的上界,mid指向待查元素所在区间的中间位置,
② 运算步骤:
(1) 上例中low =1,high =11 ,mid =6 ,待查范围是 [1,11];
(2) 若 ST.elem[mid].key < key,说明 key∈[mid+1,high] ,则令:low =mid+1;重算
(3) 若 ST.elem[mid].key > key,说明key∈[low ,mid-1], 则令:high =mid–1;重算 mid ;
(4) 若 ST.elem[ mid ].key = key,说明查找成功,元素序号=mid;
结束条件: (1)查找成功 : ST.elem[mid].key = key
(2)查找不成功 : high≤low (意即区间长度小于0)
算法的实现
public int binSearch(int array[], int k) { int low = 0; int high = array.length - 1; while (low <= high) { int mid = (low + high) / 2; if (array[mid] == k) return mid; else if (array[mid] < k) low = mid + 1; else high = mid - 1; } return -1; }
二分查找的效率(ASL)
1次比较就查找成功的元素有1个(20),即中间值;
2次比较就查找成功的元素有2个(21),即1/4处(或3/4)处;
3次比较就查找成功的元素有4个(22),即1/8处(或3/8)处…
4次比较就查找成功的元素有8个(23),即1/16处(或3/16)处…
则第h次比较时查找成功的元素会有(2h-1)个;
则第h+1次比较时查找成功的元素会有(2h)个;
为方便起见,假设表中全部n个元素= 2h+1-1个(也就是上面所有比较次数的和,此时就不用讨论第h+1次比较后还有剩余元素的情况了)
假设表的长度n =2h+1-1,
2.3、分块查找------索引顺序查找
这是一种顺序查找的另一种改进方法。
先让数据分块有序,即分成若干子表,要求每个子表中的数值(用关键字更准确)都比后一块中数值小(但子表内部未必有序)。然后将各子表中的最大关键字构成一个索引表,表中还要包含每个子表的起始地址(即头指针)。
特点:块间有序,块内无序
① 对索引表使用折半查找法(因为索引表是有序表);
② 确定了待查关键字所在的子表后,在子表内采用顺序查找法(因为各子表内部是无序表);
效率: