分治法 (Divide and Conquer)
很多有用的算法结构上是递归的,为了解决一个特定问题,算法一次或者多次递归调用其自身以解决若干子问题。这些算法典型地遵循分治法的思想:将原问题分解为几个规模较小但是类似于原问题的子问题,递归求解这些子问题,然后再合并这些问题的解来建立原问题的解。
分治法在每层递归时有三个步骤:
- 分解原问题为若干子问题,这些子问题是原问题的规模最小的实例
- 解决这些子问题,递归地求解这些子问题。当子问题的规模足够小,就可以直接求解
- 合并这些子问题的解成原问题的解
归并排序
现在我们就来看下归并排序是是如何利用分治法解决问题的。
- 分解:将待排序的 n 个元素分成各包含 n/2 个元素的子序列
- 解决:使用归并排序递归排序两个子序列
- 合并:合并两个已经排序的子序列以产生已排序的答案
考虑我们排序这个数组:[10,23,51,18,4,31,13,5] ,我们递归地将数组进行分解
当数组被完全分隔成只有单个元素的数组时,我们需要把它们合并回去,每次两两合并成一个有序的序列。
用递归代码来描述这个问题:
def merge_sort(seq): if len(seq) <= 1: # 只有一个元素是递归出口 return seq else: mid = int(len(seq)/2) left_half = merge_sort(seq[:mid]) right_half = merge_sort(seq[mid:]) # 合并两个有序的数组 new_seq = merge_sorted_list(left_half, right_half) return new_seq
注意我们这里有一个函数没实现,就是如何合并两个有序数组 merge_sorted_list。其实你在纸上画一画,合并两个有序数组并不难实现。
def merge_sorted_list(sorted_a, sorted_b): """ 合并两个有序序列,返回一个新的有序序列 :param sorted_a: :param sorted_b: """ length_a, length_b = len(sorted_a), len(sorted_b) a = b = 0 new_sorted_seq = list() while a < length_a and b < length_b: if sorted_a[a] < sorted_b[b]: new_sorted_seq.append(sorted_a[a]) a += 1 else: new_sorted_seq.append(sorted_b[b]) b += 1 # 最后别忘记把多余的都放到有序数组里 if a < length_a: new_sorted_seq.extend(sorted_a[a:]) else: new_sorted_seq.extend(sorted_b[b:]) return new_sorted_seq
这样就实现了归并排序,并且你会发现它返回一个新的数组而不是修改原有数组。
时间复杂度
我们来简单看下它归并排序的时间复杂度,假设排序 n 个数字时间复杂度是 T(n),这里为了方便假设 n 是 2 的幂
总的代价是 ,忽略常数项可以认为是 O(nlg(n))。如果这个图看不懂,我们自己求解下也不难,首先我们简化一下,把常数系数当成 1,得到以下递归式:
思考题
- 请你完成归并排序的单元测试
- 这里实现的归并排序是 inplace 的吗?
- 归并排序是稳定的吗?稳定指的是排序前后相同大小的数字依然保持相对顺序。
延伸阅读
- 《算法导论》第 2 章和第 4 章,你需要了解下『主定理』,以及如何求解形如 的递归式复杂度
- 了解算法导论上递归式的三种求解方法:代入法,递归树法,主方法