14 - divide et impera

// c’è tutto ma vorrei spiegare un po’ meglio alcuni passaggi

divide-et-impera

Il divide et impera è un approccio di risoluzione di problemi che si basa sulla divisione di un problema in sotto-problemi indipendenti, che vengono risolti ricorsivamente. In generale, è formato da 2+1 step:

divide: il problema viene suddiviso in più sotto-problemi simili a quello originale, che vengono a loro volta suddivisi ricorsivamente finché possibile

impera: si risolvono ricorsivamente i sotto-problemi

(combina: i risultati vengono combinati fino a formare una soluzione del problema di partenza)

problema della selezione

Data una lista $A$ di $n$ interi distinti e un intero $k$ , con $1 \leq k \leq n$ , vogliamo sapere quale elemento occuperebbe la posizione $k$ se il vettore venisse ordinato.

casi particolari

$k = 1$ sarà il minimo di $A$

$k = n$ sarà il massimo di $A$

$k = ⌈ \frac{n}{2} ⌉$ sarà il mediano di $A$

algoritmo naïf
Un possibile algoritmo in $Θ (n lo g n)$ è questo:
def selezione1(A, k):
	A.sort()
	return A[k-1]

Utilizzando la tecnica del divide et impera, il problema può però risolversi in $Θ (n)$ .

si dimostra quindi che il problema della selezione è computazionalmente più semplice di quello dell’ordinamento

algoritmo divide et impera

si sceglie nella lista $A$ l’elemento in posizione $A [0]$ (perno)
a partire da $A$ , si costruiscono due liste $A_{1}$ e $A_{2}$ , la prima contenente gli elementi minori del perno e la seconda contenente gli elementi maggiori del perno
per trovare l’elemento di rango $k$ :
- se $∣ A_{1} ∣ \geq k$ , l’elemento è nel vettore $A_{1}$
- se $∣ A_{1} ∣ = k - 1$ , l’elemento è il perno
- se $∣ A_{1} ∣ < k - 1$ , l’elemento è l’elemento di $A_{2}$ con rango $k - ∣ A_{1} ∣ - 1$

def selezione(A, k):
	if len(A) == 1:
		return A[0]
		
	pivot = A[0]
	A1, A2 = [], []
	
	for i in range(1,len(A)):
		if A[i] < pivot:
			A1.append(A[i])
		else:
			A2.append(A[i])
			
	if len(A1) >= k:
		return selezione(A1,k)
	elif len(A1) == k-1:
		return pivot
	return selezione(A2, k-len(A1)-1)

La procedura che tripartisce la lista in $A_{1}, A [0]$ e $A_{2}$ può restituire una partizione massimamente sbilanciata in cui ad esempio $∣ A_{1} ∣ = 0$ e $∣ A_{2} ∣ = n - 1$ se il perno è l’elemento minimo nella lista. Qualora succedesse sistematicamente per tutte le partizioni eseguite dall’algoritmo, allora la complessità dell’algoritmo sarebbe:

$T (n) = T (n - 1) + Θ (n) = Θ (n^{2})$

In generale, la complessità superiore della procedura è catturata dalla ricorrenza

$T (n) = T (m) + Θ (n)$

dove $m = ma x (∣ A_{1} ∣, ∣ A_{2} ∣)$ .

bilanciamento

Se avessimo una regola di scelta del perno in grado di garantire una partizione bilanciata, ovvero $m = \frac{n}{2}$ , allora la complessità sarebbe $T (n) = T (\frac{n}{2}) + Θ (n) = Θ (n)$ .

Ma potremmo anche accontentarci di avere partizioni non perfettamente bilanciate, ma semplicemente non troppo sbilanciate, come quelle per cui $m = \frac{3 n}{4}$ . In questo caso si avrebbe $T (n) \leq T (\frac{3}{4} n) + Θ (n) = Θ (n)$ .

In generale, finché $m$ è una frazione di $n$ , la ricorrenza dà sempre $T (n) = Θ (n)$ .

scelta equiprobabile di $p$

Se scegliamo $p$ a caso in modo equiprobabile tra gli elementi della lista, non si creerà necessariamente una partizione bilanciata ma la complessità rimane lineare in $n$ .

def selezioneR(A,k):
	if len(A)==1:
		return A[0]
		
	pivot = A[randint(0, len(A)-1)]
	A1, A2 = [], []
	
	for x in A:
		if x<pivot:
			A1.append(x)
		elif x>pivot:
			A2.append(x)
			
	if len(A1) >= k:
		return selezioneR(A1,k)
	elif len(A1) == k-1:
		return pivot
	return selezioneR(A2, k-len(A1)-1)

Analisi formale del caso medio

Con la randomizzazione introdotta per la scelta del pivot possiamo assumere che uno qualunque degli elementi del vettore, con uguale probabilità $\frac{1}{n}$ , diventi pivot e, poiché la scelta dell’elemento di rango $k$ produce $∣ A_{1} ∣ = k - 1$ e $∣ A_{2} ∣ = n - k$ , per il tempo atteso dell’algoritmo va studiata la ricorrenza:
$T (n) \leq \frac{1}{n} k = 1 \sum n T (max {T (k - 1), T (n - k)}) + Θ (n) \leq \frac{1}{n} k = ⌊ \frac{n}{2} ⌋ \sum n - 1 2 T (k) + Θ (n)$
Possiamo dimostrare che per questa ricorrenza vale $T (n) = O (n)$ tramite il metodo di sostituzione.
$T (n) = {\frac{1}{n} \sum_{k = ⌊ \frac{n}{2} ⌋}^{n - 1} 2 T (k) + a \cdot n b se n \geq 3 altrimenti$
Dimostriamo $T (n) < c n$ per una qualunque $c > 0$ costante Per $n \leq 3$ abbiamo $T (n) \leq b \leq 3 c$ che è vera ad esempio per $c \geq b$ .

Sfruttando l’ipotesi induttiva $T (k) \leq c \cdot k$ per $k < n$ abbiamo
$T (n) \leq \frac{2 c}{n} k = ⌊ \frac{n}{2} ⌋ \sum n - 1 k + a \cdot n$
da cui ricaviamo
$T (n) \leq \frac{2 c}{n} k = 1 \sum n - 1 k - k = 1 \sum ⌊ n /2 ⌋ - 1 k + a \cdot n \leq \frac{2 c}{n} (\frac{n ( n - 1 )}{2} - \frac{( \frac{n}{2} - 1 ) ( \frac{n}{2} - 2 )}{2}) + a \cdot n \leq \leq \frac{c}{n} (\frac{3 n ^{2}}{4} + \frac{n}{2} - 2) + a \cdot n \leq \frac{3 c n}{4} + \frac{c}{2} + a \cdot n = c n - (\frac{c n}{4} - \frac{c}{2} - a \cdot n) \leq c n$
dove l’ultima diseguaglianza segue prendendo $c$ in modo che $(\frac{c n}{4} - \frac{c}{2} - a \cdot n) \leq 0$ ; basta ad esempio prendere $c \geq 8 a$ .

Abbiamo quindi dimostrato che il tempo dell’algoritmo selezioneR è $O (n)$ con alta probabilità.

ovviamente, nel caso peggiore (quando si verifica che il perno scelto a caso risulta sempre vicino al massimo o al minimo della lista), la complessità dell’algoritmo rimane $O (n^{2})$ ; questo accade però con probabilità molto piccola

algoritmo deterministico in $O (n)$

Riuscire a selezionare un perno che garantisca che nessuna delle due sottoliste $A_{1}$ e $A_{2}$ abbia più di $c \cdot n$ elementi per una qualche costante $0 < c < 1$ porta ad una complessità di $O (n)$ .

Esiste un metodo chiamato mediano dei mediani che permette di selezionare un perno che garantisce sempre due sottoliste $A_{1}$ e $A_{2}$ con ciascuna non più di $\frac{3}{4} n$ elementi.

algoritmo

si divide l’insieme $A$ contenente $n$ elementi in gruppi da 5 elementi ciascuno (l’ultimo gruppo potrebbe avere meno di 5 elementi).

si considerano solo i primi $⌊ \frac{n}{5} ⌋$ gruppi, ciascuno composto esattamente da 5 elementi.

si trova il mediano di ciascuno di questi $⌊ \frac{n}{5} ⌋$ gruppi

si calcola il mediano $p$ dei mediani ottenuti al passo precedente, e si usa come pivot per $A$

esempio:

proprietà

Se la lista $A$ contiene almeno 120 elementi e il perno $p$ viene scelto in base alla regola, si può dire per certo che la dimensione delle due sottoliste sarà limitata da $\frac{3}{4} n$ .

dimostrazione $p$ ha la proprietà di trovarsi in posizone $⌈ \frac{n}{10} ⌉$ nella lista degli $⌊ \frac{n}{5} ⌋$ mediani selezionati. Ci sono dunque $⌈ \frac{n}{10} ⌉ - 1$ mediani di valore inferiore a $p$ e $⌊ \frac{n}{5} ⌋ - ⌈ \frac{n}{10} ⌉$ .

prova per $A_{2}$

Consideriamo i $⌈ \frac{n}{10} ⌉ - 1$ mediani di valore inferiore a $p$ . Ognuno di questi appartiene ad un gruppo di 5 elementi in $n$ . Ci sono dunque in $A$ altri 2 elementi inferiori a $p$ per ogni mediano. In totale abbiamo quindi

$3 (⌈ \frac{n}{10} ⌉ - 1) \geq 3 \frac{n}{10} - 3$

elementi di $A$ in $A_{1}$ .

Quindi,

$∣ A_{2} ∣ \leq n - (3 \frac{n}{10} - 3) = \frac{7}{10} n + 3 \leq \frac{3}{4} n$

(dove $\frac{7}{10} n + 3 \leq \frac{3}{4} n$ perché $n \geq 120$ ).

prova per $A_{1}$

Ci sono invece

$⌊ \frac{n}{5} ⌋ - ⌈ \frac{n}{10} ⌉ \geq (\frac{n}{5} - 1) - (\frac{n}{10} + 1) = \frac{n}{10} - 2$

mediani di valore superiore a $p$ . Ognuno di questi appartiene ad un gruppo di 5 elementi in $A$ . Ci sono quindi in $A$ altri due elementi superiori a $p$ per ogni mediano. In totale abbiamo quindi almeno $3 \frac{n}{10} - 6$ elementi di $A$ che finiranno in $A_{2}$ .

Abbiamo quindi

$∣ A_{2} ∣ \leq n - (3 \frac{n}{10} - 6) = \frac{7}{10} n + 6 \leq \frac{3}{4} n$

(dove $\frac{7}{10} n + 6 \leq \frac{3}{4} n$ perché $n \geq 120$ )

implementazione:

from math import ceil
 
def selezione(A,k):
	if len(A)<=120: # costo costante 120 log 120
		A.sort()
		return A[k-1]
	
	# inizializza B con i mediani dei len(A)//5 gruppi di 5 elementi di A
	# (sorta i gruppi di 5 e prende il terzo elemento)
	B = [sorted(A[5*1 : 5*i+5])[2] for i in range(len(A)//5)] #
	
	# individua il pivot p con la regola del mediano dei mediani
	pivot = selezione(B, ceil(len(A)/10))
	A1, A2 = [], []
	
	for x in A:
		if x<pivot:
			A1.append(x)
		elif x>pivot:
			A2.append(x)
			
	if len(A1) >= k:
		return selezione(A1,k)
	elif len(A1) == k-1:
		return pivot
	return selezione(A2, k-len(A1)-1)

sappiamo che:

ordinare 120 elementi richiede $O (1)$
ordinare una lista di $n$ elementi in gruppi da 5 richiede $Θ (n)$
selezionare i mediani dei mediani di gruppi da 5 da una lista in cui gli elementi sono stati ordinati in gruppi da 5 richiede $Θ (n)$

Sappiamo che per $n \geq 120$ , si ha $∣ A_{1} ∣ \leq \frac{3}{4} n$ e $∣ A_{2} ∣ \leq \frac{3}{4} n$ l quindi per la complessità $T (n)$ dell’algoritmo si ha:

T (n) \leq {O (1) T (\frac{n}{5}) + T (\frac{3}{4} n) + Θ (n) se n \leq 120 altrimenti

equazione di ricorrenza

La ricorrenza è del tipo

$T (n) = T (α \cdot n) + T (β \cdot n) + Θ (n)$

con $α + β = \frac{1}{5} + \frac{3}{4} = \frac{19}{20} < 1$ , e questo tipo di ricorrenze hanno tutte come soluzione $T (n) = Θ (n)$ .

dimostriamolo (metodo dell'albero)

Il fatto che $α + β < 1$ gioca un ruolo fondamentale nella prova.

Consideriamo l’albero delle chiamate ricorsive e analizziamone il costo per livelli:

al primo livello abbiamo un costo $(α + β) \cdot n$ , al secondo un costo $(α + β)^{2} \cdot n$ , al terzo un costo $(α + β)^{3} \cdot n$ e così via

Il tempo di esecuzione totale è la somma dei costi dei vari livelli:
$T (n) < c \cdot n + c \cdot (α + β) \cdot n + c \cdot (α + β)^{2} \cdot n + \dots = c n \cdot i = 0 \sum \infty (α + β)^{i} = c n \frac{1}{1 ( α + β )} = Θ (n)$
(dove nel calcolare la serie si sfrutta il fatto che $α + β < 1$ e la serie geometrica $\sum_{i = 0}^{\infty} x^{i}$ con $x < 1$ converge a $\frac{1}{1 - x}$ )

Abbiamo quindi dimostrato che il problema della selezione può essere risolto in tempo lineare., con un algoritmo che risolve il problema in $O (n)$ al caso pessimo. Tuttavia, a causa delle grandi costanti moltiplicative nascoste dall’ $O (n)$ , nella pratica l’algoritmo randomizzato che ha tempo $O (n)$ con alta probabilità si comporta molto meglio.

notes-ig

Explorer

14 - divide et impera

problema della selezione

algoritmo divide et impera

scelta equiprobabile di $p$

algoritmo deterministico in $O (n)$

Backlinks

notes-ig

Explorer

14 - divide et impera

problema della selezione

algoritmo divide et impera

scelta equiprobabile di p

algoritmo deterministico in O(n)

Backlinks

scelta equiprobabile di $p$

algoritmo deterministico in $O (n)$