11 - decomposizioni che hanno un join senza perdita

Se si decompone uno schema di relazione $R$ , si vuole che la decomposizione ottenuta sia tale che che ogni istanza legale $r$ di $R$ sia ricostruibile mediante join naturale da un’istanza legale ${r_{1}, r_{2}, \dots, r_{k}}$ dello schema decomposto ${R_{1}, R_{2}, \dots, R_{k}}$ .

definizione

Sia $R$ uno schema di relazione. Una decomposizione $ρ = {R_{1}, R_{2}, \dots, R_{k}}$ di $R$ ha un join senza perdita se per ogni istanza legale di $r$ si ha: $r = π_{R_{1}} (r) ⋈ π_{R_{2}} ⋈ \dots ⋈ π_{R_{k}} (r)$

introduciamo $m_{p} (r)$

definiamo $m_{ρ} (r) = π_{R_{1}} (r) ⋈ π_{R_{2}} ⋈ \dots ⋈ π_{R_{k}} (r)$

join naturale delle proiezioni dei sottoschemi su $r$ (che deve quindi essere uguale a $r$ stessa)

in pratica

Dato uno schema $R = A_{1} A_{2} A_{3} \dots A n$ , un sottoschema $R_{i}$ è un suo sottoinsieme (es. $A_{1} A_{2} A_{3}$ ). La proiezione $π_{R_{i}} (r)$ di un’istanza legale $r$ su un sottoschema $R_{i}$ prende ogni tupla di $r$ e mantiene solo gli attributi che appartengono a $R_{i}$ .

Per esempio, se ho $R = A BC$ con le dipendenze funzionali $F = {A \to B, C \to B}$ con quest’istanza legale $r$ :

Con i sottoschemi $R_{1} = A B$ , $R_{2} = BC$ , $r$ si decompone in:

(le tuple manterranno solo gli attributi di $R_{i}$ )

(nella proiezione su $R_{2}$ , si “perde” una tupla perché risulta duplicata).

In questo caso, effettuando il join delle due decomposizioni, non otteniamo l’istanza legale di partenza:

teorema

Sia $R$ uno schema di relazioni e $ρ = R_{1}, R_{2}, \dots, R_{k}$ . Per ogni istanza legale $r$ di $R$ e per il “suo” $m_{ρ}$ si ha:

$r \subseteq m_{ρ} (r)$ - non serve dimostrarlo perché $m_{ρ} (r)$ non potrà mai contenere istanze in meno, quindi al minimo è $= r$
$π_{R_{i}} (m_{ρ}) = π_{R_{i}} (r)$
- $π_{R_{i}} (r) \subseteq π_{R_{i}} (m_{ρ})$ deriva da (1)
- $π_{R_{i}} (r) \supseteq π_{R_{i}} (m_{ρ})$ : per ogni tupla $t \in m_{ρ} (r)$ ne esiste un’altra $t^{'} \in r$ tale che $t [R_{i}] = t^{'} [R_{i}]$ (altrimenti non avremmo $t [R_{i}]$ in $π_{R_{i}} (r)$ e quindi nel join)
$m_{ρ} (m_{ρ} (r)) = m_{ρ} (r)$

(dimostrazioni non richieste per l’orale)

verifica

esiste un algoritmo che permette di verificare se una decomposizione data ha un join senza perdita in tempo polinomiale:

input: uno schema di relazione $R$ , un insieme $F$ di dipendenze funzionali su $R$ , una decomposizione $ρ = {R_{1}, R_{2}, \dots, R_{3}}$
output: decide se $ρ$ ha un join senza perdita

begin Costruisci una tabella r nel modo seguente: r ha # R colonne e # ρ righe all’incrocio dell’i-esima riga e della j-esima colonna metti il simbolo a_{j} se l’attributo A_{j} \in R_{i} il simbolo b_{ij} altrimenti repeat for every X \to Y \in F do if ci sono due tuple t_{1} e t_{2} in r tali che t_{1} [X] = t_{2} [X] e t_{1} [Y] \neq = t_{2} [Y] then for every attribute A_{j} \in Y do if t_{1} [A_{j}] =^{'} a_{j}^{'} then t_{2} [A_{j}] := t_{1} [A_{j}] else t_{1} [A_{j}] := t_{2} [A_{j}] until r ha una riga con tutte ’a’ or r non \overset{e}{ˋ} cambiato if r ha una riga con tutte ’a’ then ρ ha un join senza perdita else ρ non ha un join senza perdita

quando finisce l’algoritmo, o:

sono arrivato alla fine e non posso più cambiare cose (è un’istanza legale)
mi fermo in anticipo - le a non possono diventare b, e ho trovato una tupla di tutte a (so già che l’istanza diventerà legale alla fine dell’algoritmo, e posso fermarmi perché non ho perdite)

spieghiamo meglio

costruiamo una tabella $r$ in modo da evere un numero di colonne pari al numero di attributi in $R$ e un numero di righe pari al numero di sottoschemi nella decomposizione $ρ$

nelle celle ad indice $i$ per le righe e $j$ per le colonne, inseriamo $a_{j}$ se l’attributo della colonna $j$ appartiene al sottoschema della riga $i$ - altrimenti inseriamo $b_{ij}$

adesso, per ogni dipendenza $X \to Y \in F$ , controlliamo se nella tabelle i sono tuple che non rispettano la dipendenza (ovvero $t_{1} [X] = t_{2} [X]$ e $t_{1} [Y] \neq = t_{2} [Y]$ ) - le “facciamo diventare legali”: se in una tupla è presente una $a$ nell’attributo $Y$ , la propaghiamo a tutte le altre, altrimenti scegliamo un $b$ a piacere e lo propaghiamo su tutte le altre (due attributi sono uguali se hanno entrambi $a$ o una $b$ con lo stesso pedice)

esempio

dati $R = (A, B, C, D)$ e $F = {C \to D, A B \to E, D \to B}$ dire se la decomposizione $ρ = {A C, A D E, C D E, A D, B}$ ha un join senza perdite

center

prima iterazione: center

in ordine rispetto alle dipendenze funzionali:

$C \to D$ : la prima e la terza riga coincidono su $C = a 3$ - cambiamo $b 14$ in $a 4$ in modo che la dipendenza funzionale sia soddisfatta
$A B \to E$ è già soddisfatta
$D \to B$ : nelle prime quattro righe, $D = a 4$ , quindi cambiamo $b 22$ , $b 32$ , $b 42$ in $b 12$

seconda iterazione: center

$C \to D$ è già soddisfatta
$A B \to E$ : prima, seconda e quarta riga coincidono su $A B$ , quindi cambiamo $b 15$ e $b 45$ in $a 5$
$D \to B$ è già soddisfatta

terza iterazione (fine): center

non c’è più nulla da cambiare quindi l’algoritmo termina.

Bisogna verificare se c’è una tupla con tutte $a$ - non c’è, quindi il join non è senza perdita.

teorema

Sia $R$ uno schema di relazione, $F$ un insieme di dipendenze funzionali su $R$ e $ρ = {R_{1}, R_{2}, \dots, R_{k}}$ una decomposizione di $R$ . L’algoritmo di verifica decide correttamente se $ρ$ ha un join senza perdita.

dimostrazione

Occorre dimostrare che $ρ$ ha un join senza perdita (ovvero $m_{ρ} = r$ per ogni $r$ legale) $⟺$ quando l’algoritmo termina, la tabella ha una tupla con tutte ‘a’.

Si dimostra solo la parte “join senza perdita $⟹$ tupla con tutte ‘a’“.

Supponiamo per assurdo che $ρ$ abbia un join senza perdita $(m_{ρ} (r) = r)$ e che al termine dell’algoritmo la tabella $r$ non abbia una tupla con tutte ‘a’. La tabella $r$ (finale) può essere interpretata come un’istanza legale di $R$ , in quanto al termine dell’algoritmo non ci sono violazioni di dipendenze in $F$ .

La tabella $r$ iniziale contiene ‘a’ in ogni riga per gli attributi che appartengono al sottoschema a cui fa riferimento quella riga.

esempio:

Quindi ogni proiezione $π_{R_{i}} (r)$ della tabella su un sottoschema avrà una tupla di tutte ‘a’ (la riga che corrisponde a $R_{i}$ .)

per esempio, proiezione su $A B D E$ :

Quando si fa il join naturale tra due proiezioni $π_{R_{i}} (r)$ ed $π_{R_{j}} (r)$ (con le loro tuple con tutte ‘a’ che chiamiamo $t_{i}$ e $t_{j}$ ), ci sono due casi:

o $R_{i}$ e $R_{j}$ condividono (almeno) un attributo ⇒ sappiamo che $t_{i}$ e $t_{j}$ avranno lo stesso valore su quell’attributo (‘a’), e quindi saranno unite, formando un’unica tupla con tutte ‘a’

o le due proiezioni non hanno attributi in comune ⇒ in questo caso il join naturale degenererà in prodotto cartesiano, e tutte le tuple di $π_{R_{i}} (r)$ e $π_{R_{j}} (r)$ saranno unite (quindi anche $t_{i}$ e $t_{j}$ )

In entrambi casi, il join naturale ci porterà ad unire $t_{i}$ e $t_{j}$ e ad avere una tupla con tutte ‘a’.

Visto che $m_{ρ} (r)$ è il join naturale di tutte le proiezioni, esso contiene quindi sicuramente una tupla con tutte ‘a’. L’ipotesi di partenza, per cui abbiamo un join senza perdita ci impone che $m_{ρ} (r) = r$ , contraddicendo quindi la supposizione per cui $r$ non ha tuple con tutte ‘a’.

Abbiamo quindi dimostrato che “join senza perdita $⟹$ tupla con tutte ‘a‘“.

domande orale

possibili domande orale

come definiamo $m_{ρ} (r)$ ?

quando una decomposizione ha join senza perdita?

teorema su $m_{ρ} (r), r, π_{R_{i}}$

dimostrazione join senza perdita $⟹$ riga con tutte a

notes-ig

Explorer

11 - decomposizioni che hanno un join senza perdita

teorema

verifica

esempio

teorema

domande orale

Table of Contents

Backlinks