7 - terza forma normale

Torniamo al nostro esempio di base di dati che contiene informazioni su studenti ed esami (soluzione “buona” trovata alla fine)

La base di dati consiste di quattro schemi di relazione:

Studente (Matr, CF, Cogn, Nome, Data, Com)
Corso (C#, Tit, Doc)
Esame (Matr, C#, Data, Voto)
Comune (Com, Prov)

considerazioni

dipendenze funzionali su Studente

Studente

$Matr \to CF$

$Matr \to Cogn$

$Matr \to Nome$

$Matr \to Data$

$Matr \to Com$

quindi, un’istanza legale di Studente deve soddisfare: $Matr \to CF, Cogn, Nome, Data, Com$ in realtà notiamo che anche CF determina tutte le altre cose: $CF \to Matr, Cogn, Nome, Data, Com$ Quindi, sia $Matr$ che $CF$ sono chiavi

possiamo notare che le istanze di Studente non devono soddisfare $Cogn \to Nome$ o $Cogn \to Data$ o $Cogn \to Com$ ecc.

Con considerazioni analoghe possiamo quindi concludere che le uniche dipendenze funzionali non banali che devono essere soddisfatte da un’istanza legale di Studente sono del tipo: $K \to X$ dove K contiene una chiave (Matr o CF)

(qui iniziamo a notare che le dipendenze devono tipicamente essere solo da una chiave o superchiave)

dipendenze funzionali su esame

Esame (Matr, C#, Data, Voto)

(in questo universo) uno studente può sostenere l’esame relativo ad un corso una sola volta, quindi per ogni esame esistono:

una sola data e un solo voto

Quindi, ogni istanza legale di Esame deve soddisfare: $(Matr, C#) \to (Data, Voto)$

Pertanto, $(M a t r, C #)$ è l’unica chiave per Esame.

conclusione

Il nostro schema di relazione è quindi:

Studente (Matr, CF, Cogn, Nome, Data, Com)

Corso (C#, Tit, Doc)

Esame (Matr, C#, Data, Voto)

Comune (Com, Prov)

terza forma normale

Uno schema di relazione è 3NF se:

le uniche dipendenze funzionali non banali che devono essere soddisfatte da ogni istanza legale sono del tipo: $K \to X$ dove:
K contiene una chiave oppure
X è contenuto in una chiave

Ma anche questa condizione deve ancora essere rifinita.

definizione

Dati uno schema di relazione R e un insieme di dipendenze funzionali F su R, R è in 3NF se: $\forall X \to A \in F^{+}, A \neq \in X$

X contiene una chiave (è superchiave) oppure

A appartiene ad una chiave (è primo)

(notiamo quel $A \neq \in X$ - quelle dipendenze non vanno considerate quando si cerca di capire se uno schema è in 3NF)

Altra definizione - se si vuole usare un insieme (Y) invece del singleton A:

$\forall X \to Y \in F$ appartente a X è tale che X è superchiave e ogni attributo contenuto in Y è primo.

attenzione

è sbagliato scrivere $\forall X \to A \in F$ , (invece di $F^{+}$ ) perché A è singleton e dovremmo escludere tutte quelle del tipo $X \to A B$ (che potrebbero violare la 3NF) (invece, per $X \to A B$ , $X \to A$ si trova in $F^{+}$ )

è sbagliato anche dire solo $\forall X \to Y \in F$ (devo specificare che ogni attributo di Y è primo)

è importante non dimenticare il $A \neq \in X$ . Infatti, per riflessività, abbiamo sempre $X \to A$ in $F^{A}$ , e quindi in $F^{+}$ , anche quando A non è primo e X non è superchiave (quindi, nessuno schema sarebbe 3NF) (per esempio, se avessi $R = A B$ e $F = {A \to B}$ , all’interno di $F^{+}$ avrei anche $B \to B$ , con $B$ che non è né chiave né primo)

esempio 1

$R = A BC D F = {A \to B, B \to C D}$

la chiave è A (per ogni istanza legale, se $t_{1} [A] = t_{2} [A]$ allora $t_{1} [B] = t_{2} [B]$ e, se $t_{1} [B] = t_{2} [B]$ allora $t_{1} [C D] = t_{2} [C D]$ - quindi se $t_{1} [A] = t_{2} [A]$ allora $t_{1} [C D] = t_{2} [C D]$ ( $A \to B$ e $B \to C D$ , quindi $A \to C D$ )

ed è anche l’unica chiave, perché B non determina A, e sia C che D non determinano altri attributi

ma è 3NF? valutiamo le dipendenze in $F$ :

$A \to B$ è ok (A è superchiave)

$B \to C D$ ? dobbiamo controllare $B \to C$ e $B \to D$ - entrambe violano la 3NF perché B non è superchiave e né C né D sono primi - quindi lo schema R non è in 3NF

esempio 2

$R = A BC D F = {A B \to C D, BC \to A, D \to A C}$

le chiavi sono:

$A B$ ( $\to C D$ )

$B D$ (ho $D \to A C$ - per aumento, aggiungo $B$ e ho $B D \to A C$ )

$BC$ (ho $BC \to A$ - per aumento, aggiungo $B$ a sinistra - ho $BC \to A B$ , e $A B \to C D$ , quindi, per transitività, ho anche $BC \to C D$ )

è 3NF? controlliamo le dipendenze in $F$ .

$A B \to C D$ è ok, $A B$ è chiave

$BC \to A$ è ok, $BC$ è chiave

$D \to A C$ va decomposto: $D \to A$ è ok perché $A$ è primo, e la stesa cosa vale per $D \to C$

quindi lo schema è 3NF

dipendenze parziali e transitive

Siano R uno schema di relazione e F un insieme di dipendenze funzionali su R.

dipendenza parziale

$X \to A \in F^{+} ∣ A \neq \in X$ è una dipendenza parziale su $R$ se $A$ non è primo ed $X$ è contenuto propriamente in una chiave di $R$ . (quindi, invece di $X$ superchiave ho $X$ primo - è contenuto invece di contenere - non è rispettata la 3NF)

esempio

Per esempio, nella relazione

$Curriculum(Matr, CF, Cogn, Nome, DataN, Com, Prov, C#, Tit, Doc, DataE, Voto)$

(con $M a t r, C #$ chiave), abbiamo $M a t r \to C o g n$ .

Quindi, ad una coppia numero di matricola-codice corso, corrisponde un solo cognome: $(M a t r, C #) \to C o g n$ - l’attributo $C o g n$ dipende parzialmente dalla chiave $M a t r, C #$ , perché è la conseguenza di $M a t r \to C o g n$ (e $M a t r$ è contenuto propriamente in una chiave)

dipendenza transitiva

$X \to A \in F^{+} ∣ A \neq \in X$ è una dipendenza transitiva su $R$ se $A$ non è primo e per ogni chiave $K$ di $R$ si ha che $X$ non è contenuto propriamente in $K$ e $K - X \neq = \emptyset$ (quindi, $X$ non è superchiave - magari una parte di $X$ lo è, ma non tutto $X$ - non è rispettata la 3NF)

esempio

$Studente (Matr, CF, Cogn, Nome, Data, Com, Prov)$

con $M a t r$ chiave

Abbiamo $M a t r \to C o m$ e $C o m \to P ro v$ . Per transitività, $M a t r \to P ro v$ . Ma $C o m$ non è contenuto propriamente nella chiave.

attenzione

la dipendenza transitiva non è quella che si trova per transitività, ma quella che “permette di usare la transitività” - $A \to B, B \to C$ implica $A \to C$ , ma la dipendenza transitiva è $B \to C$ .

definizione alternativa di 3NF

Dato uno schema R e un insieme di dipendenze funzionali F, R è in 3NF se e solo se non ci sono attributi che dipendono parzialmente o transitivamente da una chiave.

dimostrazione

prima parte $lo schema R \overset{e}{ˋ} in 3NF ⟹ non esistono dipendenze parziali o transitive$

(per ipotesi, lo schema è 3NF, quindi) Per quanto riguarda $\forall X \to A \in F^{+}, A \neq \in X$ , abbiamo due casi:

o $X$ contiene una chiave (è superchiave)
o $A$ appartiene a una chiave (è primo)

da qui:

se $A$ primo, viene a mancare la prima condizione per avere una dipendenza parziale o transitiva (entrambe vogliono $A$ non primo)
se $A$ non primo, allora $X$ è superchiave (contiene una chiave) - non può quindi essere contenuto propriamente in una chiave, e non è neanche possibile che $K - X \neq = \emptyset$ (in quanto contiene tutta la chiave)

ora passiamo alla

seconda parte $lo schema R \overset{e}{ˋ} in 3NF ⟸ non esistono dipendenze parziali o transitive$

(per ipotesi, non esistono dipendenze parziali o transitive) supponiamo per assurdo che $R$ non sia 3NF - allora c’è almeno una dipendenza che viola la 3NF, quindi: $X \to A \in F^{+}$ tale che:

$A$ non è primo E
$X$ non è superchiave

Siccome $X$ non è superchiave, ci sono due casi mutualmente esclusivi:

per ogni chiave $K$ di $R$ , $X$ non è contenuto propriamente in nessuna chiave e $K - X \neq = \emptyset$ - ma questa è la definizione di dipendenza transitiva (contraddizione)
$X \subset K$ - esiste una chiave che contiene completamente $X$ (e non è uguale a $X$ ) - in questo caso, $X \to A$ è una dipendenza parziale (contraddizione)

cosa vogliamo ottenere?

un obiettivo da tenere presente quando si progetta una base di dati è quello di produrre uno schema in cui ogni relazione sia in 3NF
- in caso non lo sia, è sempre possibile trovare una decomposizione che sia in 3NF, e che rispetti altre due proprietà:

Abbiamo uno schema $A BC$ con dipendenze funzionali $F = {A \to B, B \to C}$ lo schema non è in 3NF perché in $F^{+}$ è presente $B \to C$ (la chiave è $A$ ).

$R$ può essere decomposto in:
- $R_{1} = A B con {A \to B}$
- $R_{2} = A B con {B \to C}$
oppure
- $R_{1} = A B con {A \to B}$
- $R_{2} = A C con {A \to C}$

entrambi sono in 3NF, ma il secondo non è soddisfacente.

perché?

Consideriamo due istanze legali degli schemi ottenuti:

l’istanza dello schema originario R che posso ricostruire (con il join naturale) è:

questa non è però un’istanza legale di R, perché non soddisfa la dipendenza funzionale $B \to C$

join senza perdita

deve essere preservato il join senza perdita (devono essere mantenute tutte le dipendenze originarie) - una “perdita” non significa tuple in meno, ma presenza di tuple estranee alla realtà di interesse.

esempio

consideriamo lo schema

$R = (Matricola, Comune, Provincia)$

$F = {M a t r i co l a \to C o m u n e, C o m u n e \to P ro v in c ia}$

(con chiave $M a t r i co l a$ ) non è in 3NF a causa della dipendenza transitiva $C o m u n e \to P ro v in c ia$ .

Può essere scomposto in:

$R_{1} = (M a t r i co l a, C o m u n e)$ con ${M a t r i co l a \to C o m u n e}$

$R_{2} = (C o m u n e, P ro v in c ia)$ con ${C o m u n e \to P ro v in c ia}$

oppure

$R_{1} = (M a t r i co l a, C o m u n e)$ con ${M a t r i co l a \to C o m u n e}$

$R_{2} = (M a t r i co l a, P ro v in c ia)$ con ${M a t r i co l a \to P ro v in c ia}$

entrambi sono in 3NF, ma la seconda soluzione non è soddisfacente.

Consideriamo le istanze legali degli schemi ottenuti:

L’istanza dello schema originario $R$ che ricostruisco tramite join naturale è la seguente:

ma questa non è un’istanza legale di $R$ !! perché non soddisfa la dipendenza funzionale $C o m u n e \to P ro v in c ia$

In conclusione, quando si decompone uno schema per ottenerne uno 3NF, occorre tenere presente altri due requisiti per lo schema decomposto:

deve preservare le dipendenze funzionali che valgono su ogni istanza legale dello schema originale
deve permettere di ricostruire tramite join naturale ogni istanza legale dello schema originario senza aggiunta di informazione estranea.

forma normale di Boyce-Codd

definizione

Una relazione è in forma normale di Boyce-Codd (BCNF) se in essa ogni determinante è una superchiave (ricordiamo che ogni chiave è superchiave).

(boy’s code per gli amici)

Ogni relazione in Boyce-Codd è anche in 3NF, ma non vale il contrario

può non essere possibile decomporre uno schema non BCNF ottenendo sottoschemi BNCF e preservando allo stesso tempo tutte le dipendenze - invece, è sempre possibile per la 3NF

domande orale

possibili domande orale:

definizione 3NF

definizione dipendenze parziali e transitive

3NF $⟺$ no dipendenze parziali e transitive

perché nella 3NF prendiamo $F^{+}$ e non $F$ ?

perché $A \neq \in X$ ?

cosa si fa quando si ha uno schema non in 3NF?

forma Boyce-Codd

perché nel caso della forma Boyce-Codd non è assolutamente possibile che si violino dipendenze? (perché i determinanti sono superchiavi e non ci possono essere due chiavi con lo stesso valore, quindi vengono meno le premesse per violare dipendenze)

notes-ig

Explorer

7 - terza forma normale

considerazioni

terza forma normale

dipendenze parziali e transitive

dimostrazione

cosa vogliamo ottenere?

forma normale di Boyce-Codd

domande orale

Table of Contents

Backlinks