10 - decomposizioni che preservano le dipendenze

bisogna formalizzare il concetto di decomposizione che preserva un insieme di dipendenze funzionali.

definizione di decomposizione

Sia $R$ uno schema di relazione. Una decomposizione di $R$ è una famiglia $ρ = {R_{1}, R_{2}, \dots R_{k}}$ di sottoinsiemi di $R$ che ricopre $R$ , ovvero: $⋃_{i = 1}^{k} R_{i} = R$

essenzialmente, decomporre $R$ significa definire dei sottoschemi che contengono ognuno un sottoinsieme degli attributi di $R$ .

La proiezione di $F$ su un certo elemento $R_{i}$ contiene:

le dipendenze funzionali di $F^{+}$ la cui unione di determinante e determinato fa parte di $R_{i}$ (quindi le dipendenze con elementi in $R_{i}$ )

Visto che due insiemi di dipendenze si possono scambiare quando hanno la stessa chiusura, una decomposizione preserva $F$ se la chiusura di $F$ è uguale alla chiusura dell’insieme $G = {unione delle proiezioni di F sui vari R_{i}}$ .

equivalenza tra due insiemi di dipendenze funzionali

Siano $F$ e $G$ due insiemi di dipendenze funzionali. $F$ e $G$ sono equivalenti $(F \equiv G)$ se $F^{+} = G^{+}$ .

ovvero non sono uguali ma hanno la stessa chiusura.

lemma 2

Siano $F$ e $G$ due insiemi di dipendenze funzionali. $F \subseteq G^{+} ⟺ F^{+} \subseteq G^{+}$ .

dimostrazione $F \subseteq G^{+} ⟹ F^{+} \subseteq G^{+}$

Sia $f \in F^{+} - F$ (una dipendenza di $F^{+}$ che non compare in $F$ ).

noi sappiamo che ogni dipendenza funzionale in $F$ è derivabile da $G$ mediante gli assiomi di Armstrong (perché $F \subseteq G^{+}$ , e $G^{+} = G^{A}$ , quindi le dipendenze di $F$ sono dipendenze di $G^{A}$ )

anche $F^{+} (= F^{A})$ (e quindi $f \in F^{+}$ ) è derivabile da $F$ tramite gli assiomi di Armstrong.

quindi, si ha $G \to A F \to A F^{A} = F^{+}$

(ottengo $F$ da $G$ mediante Armstrong e poi, sempre mediante Armstrong, anche $F^{A} = F^{+}$ .)

Il punto cruciale è che, applicando solo gli assiomi di Armstrong su un sottoinsieme di $G$ , non “esco” mai da $G^{+} = G^{A}$

quindi, $f \in F^{+} - F$ è derivabile da $G$ con gli assiomi di Armstrong, e $F^{+} \subseteq G^{+}$

preservare le dipendenze

definizione

Sia $R$ uno schema di relazione, $F$ un insieme di dipendenze funzionali su $R$ , e $ρ = {R_{1}, R_{2}, \dots, R_{K}}$ una decomposizione di $R$ . Diciamo che $ρ$ preserva $F$ se: $F \equiv ⋃_{i = 1}^{k} π_{R i} (F)$ dove $π_{R i} (F) = {X \to Y ∣ X \to Y \in F^{+} \land X Y \subseteq R_{i}}$

ogni $π_{R i}$ è un insieme di dipendenze funzionali dato dalla proiezione di $F$ su $R_{i}$

proiettare un insieme di dipendenze su un sottoschema significa prendere tutte e sole le dipendenze in $F^{+}$ che hanno tutti gli attributi in $R_{i}$

verifica

Supponiamo di avere una decomposizione e voler verificare se preserva le dipendenze funzionali. Questo corrisponde a verificare che $G \equiv F$ , ovvero che $G^{+} \subseteq F^{+}$ e che $F^{+} \subseteq G^{+}$ .

utilità del lemma 2 per la verifica

Grazie al lemma 2, per verificare che $F^{+} = G^{+}$ mi basta verificare che $F \subseteq G^{+}$ e che $G^{+} \subseteq F$ .

La verifica di $G \subseteq F^{+}$ è superflua, perché tutti gli elementi di $G$ sono necessariamente in $F^{+}$

(infatti $G$ è definito come l’unione della proiezione di $F$ sulle varie decomposizioni, quindi l’unione di tutte le dipendenze di $F^{+}$ che hanno determinante e dipendente in $R_{i}$ → è possibile che in $G$ non ci siano alcune dipendenze di $F^{+}$ , ma non il contrario)

Quindi, bisogna solo verificare che $F \subseteq G^{+}$ .

Grazie al lemma 1, mi basta verificare che $\forall X \to Y \in F, Y \subseteq X_{G}^{+}$

Si può fare con l’algoritmo che segue:

basta verificare che una sola dipendenza non appartiene alla chiusura di G per affermare che l’equivalenza non sussiste

algoritmo

input - due insiemi $F$ , $G$ di dipendenze funzionali su $R$

output - la variabile successo, che indica se $F \subseteq G^{+}$

$begin successo := t r u e for every X \to Y \in F do begin calcola X^{+} if Y \neq \subset X_{G}^{+} then successo := f a l se end end$

se $Y \neq \subset X_{G}^{+}$ , allora $X \to Y \neq \in G^{A}$ per il lemma, ovvero $X \to Y \neq \in G^{+}$ per il Teorema

basta fare i controlli solo per le dipendenze “a cavallo” - quelle che hanno sia determinante che dipendente in una decomposizione sono rispettate per forza

Nasce un problema: come calcoliamo $X_{G}^{+}$ ? Potremmo usare l’algoritmo per il calcolo della chiusura di un insieme di attributi, ma dovremmo prima calcolare $G$ , e quindi $F^{+}$ , il che richiederebbe tempo esponenziale.

Per questo, esiste un algoritmo:

calcolo della chiusura di X rispetto a G a partire da F

input - uno schema $R$ , un insieme $F$ di dipendenze funzionali su $R$ , una decomposizione $ρ = {R_{1}, R_{2}, \dots, R_{k}}$ , un sottoinsieme $X$ di $R$ .
output - la chiusura di $X$ rispetto a $G = \cup_{i = 1}^{k} π_{R i} (F)$

begin Z := X S := \emptyset for i := 1 to k do S := S \cup (Z \cap R_{i})_{F}^{+} \cap R_{i} while S \neq \subset Z do begin Z := Z \cup S for i := 1 to k do S := S \cup (Z \cap R_{i})_{F}^{+} \cap R_{i} end end

partendo da un sottoinsieme di attributi $X$ di $R$ , per prima cosa definiamo $Z$ come $X$ stesso per riflessività.
dopodiché, ad ogni iterazione: $S := S \cup (Z \cap R_{i})_{F}^{+} \cap R_{i}$ fa:
- prima l’interzezione tra $Z$ e $R_{i}$ , per considerare solo gli elementi di $Z$ che riguardano quello specifico sottoinsieme
- poi la chiusura di quell’intersezione rispetto ad $F$ , per trovare tutti gli attributi che ci interessano (tutti quelli determinati da dipendenze in $F^{+}$ )
- dopodiché l’intersezione con $R_{i}$ , perché dobbiamo tenere solo gli attributi che sono effettivamente in $R_{i}$ (per la questione dipendenze con det e dip in $R_{i}$ )
- e infine l’unione con l’accumulatore $S$ , dove salviamo questo passo fatto per tutti i sottoinsiemi $R_{i}$
  - nota: ad ogni iterazione (prima dell’unione con $S$ ), potremo ottenere massimo $R_{i}$ stesso (per l’intersezione con $R_{i}$ )
- ho trovato quindi la chiusura rispetto a ogni singolo $R_{i}$ , e quindi rispetto a $G$
- quindi, avremo gli attributi che dipendono funzionalmente da $X$ , anche se appartengono a sottoschemi in cui $X$ non è incluso - perché dipendono da attributi che si trovano nello stesso sottoschema di $X$ e dipendono da $X$ , e anche in altri sottoschemi

esempio inventato del passo cruciale

$R = (A, B, C, D, E, H)$

$R_{1} = (A, B), R_{2} = (C, D), R_{3} = (E, H)$

cerchiamo $(A E)_{G}^{+}$

$Z = A E$

il passo prima dell’unione con $S$ :

$Z \cap R_{1} = A$

trovo $A_{F}^{+}$

$A_{F}^{+} \cap R_{1} \subseteq A B$

poi aggiungo a $S$

(anche qui il latex dell’algoritmo rubato a flavio, che si diverte a fare queste cose)

dimostrazione

dimostrare che l’algoritmo funziona significa mostrare che, alla fine dell’algoritmo, $Z$ conterrà tutta e sola la chiusura di $X$ rispetto a $G$ . Quindi, che $Z^{f} \subseteq X_{G}^{+} \land Z^{f} \supseteq X_{G}^{+}$ .

Dimostriamo solo $Z^{f} \subseteq X_{G}^{+}$ .

ricordiamo:

$G = \cup_{i = 1}^{k} π_{R_{i}} (F)$ , con $π_{R_{i} (F)} = {X \to Y ∣ X \to Y \in F^{+} \land X Y \subseteq R_{i}}$

$S := S \cup (Z \cap R_{i})_{F}^{+} \cap R_{i}$ (passo fondamentale dell’algoritmo)

Si dimostra per induzione sui $i$ ( $\forall i, Z^{i} \subseteq X_{G}^{+}$ )

caso base ( $i = 0$ ): $Z^{0} = X$ , e $X \subseteq X^{+}$ , quindi $Z^{0} \subseteq X_{G}^{+}$

ipotesi induttiva: $Z^{i - 1} \subseteq X_{G}^{+}$

passo induttivo: Sia $A \in Z^{i} - Z^{i - 1}$ (aggiunto all’ultimo passo). Se $A$ è stato aggiunto, vuol dire che deve esistere un sottoschema $R_{j}$ della decomposizione tale che: $A \in (Z^{i - 1} \cap R_{j})_{F}^{+} \cap R_{j}$ , ovvero $A \in (Z^{i - 1} \cap R_{j})_{F}^{+} \land A \in R_{j}$ .

Abbiamo quindi:

$(Z^{i - 1} \cap R_{j}) \to A \in F^{A} = F^{+}$ (per il lemma 1 e teorema $F^{+} = F^{A}$ ).

Sappiamo che $A \in R_{j}$ , ma anche $(Z^{i - 1} \cap R_{j}) \subseteq R_{j}$ . Notiamo quindi che la dipendenza $(Z^{i - 1} \cap R_{j}) \to A$ ha sia determinante che dipendente in un sottoschema $R_{j}$ , e quindi, per definizione di $π_{R_{i} (F)} = {X \to Y \in F^{+} : X Y \subseteq R_{i}}$ , appartiene a $π_{R_{j}} (F)$ e, per costruzione di $G = ⋃_{i = 0}^{n} π_{R_{i}} (F)$ , appartiene a $G$ .

quindi $(Z^{i - 1} \cap R_{j}) \to A \subseteq G \subseteq G^{+} = G^{A}$

In più, $(Z^{i - 1} \cap R_{j}) \subseteq Z^{i - 1}$ , e, per ipotesi induttiva $Z^{i - 1} \subseteq X_{G}^{+}$ . Quindi si ha $(Z^{i - 1} \cap R_{j}) \subseteq X_{G}^{+}$ (decomposizione) e, per il lemma 1, $X \to (Z^{i - 1} \cap R_{j}) \in G^{A}$ . Per transitività, da $X \to (Z^{i - 1} \cap R_{j}), (Z^{i - 1} \cap R_{j}) \to A \in G^{A}$ , si ha $X \to A \in G^{A}$ , cioè (l.1) $A \in X_{G}^{+}$ .

abbiamo quindi dimostrato che $A \in Z^{i} ⟹ A \in X_{G}^{+}$ , ovvero $Z^{i} \subseteq X_{G}^{+} \forall i$

domande orale

possibili domande

cosa vuol dire che una decomposizione preserva un insieme di dipendenze?

dimostrazione Lemma 2

(forse) quali dipendenze bisogna controllare e quali no per l’algoritmo?

dimostrazione calcolo di $X_{G}^{+}$ a partire da $F$

notes-ig

Explorer

10 - decomposizioni che preservano le dipendenze

lemma 2

preservare le dipendenze

verifica

calcolo della chiusura di X rispetto a G a partire da F

domande orale

Table of Contents

Backlinks