Der Begriff Datenintegrität bezieht sich auf die Genauigkeit und Konsistenz der Daten.
Beim Erstellen von Datenbanken muss auf die Datenintegrität und deren Pflege geachtet werden. Eine gute Datenbank wird die Datenintegrität erzwingen, wann immer möglich.
Beispielsweise könnte ein Benutzer versehentlich versuchen, eine Telefonnummer in ein Datumsfeld einzugeben. Wenn das System die Datenintegrität erzwingt, verhindert es, dass der Benutzer diese Fehler macht.
Die Aufrechterhaltung der Datenintegrität bedeutet, dass die Daten während ihres gesamten Lebenszyklus intakt und unverändert bleiben., Dazu gehören die Erfassung der Daten, Speicherung, Updates, Übertragungen, Backups usw. Jedes Mal, wenn Daten verarbeitet werden, besteht die Gefahr, dass sie beschädigt werden (ob versehentlich oder böswillig).
Risiken für die Datenintegrität
Einige weitere Beispiele, bei denen die Datenintegrität gefährdet ist:
- Ein Benutzer versucht, ein Datum außerhalb eines akzeptablen Bereichs einzugeben.
- Ein Benutzer versucht, eine Telefonnummer im falschen Format einzugeben.
- Ein Fehler in einer Anwendung versucht, den falschen Datensatz zu löschen.,
- Beim Übertragen von Daten zwischen zwei Datenbanken versucht der Entwickler versehentlich, die Daten in die falsche Tabelle einzufügen.
- Beim Übertragen von Daten zwischen zwei Datenbanken ging das Netzwerk aus.
- Ein Benutzer versucht, einen Datensatz in einer Tabelle zu löschen, aber eine andere Tabelle verweist auf diesen Datensatz als Teil einer Beziehung.
- Ein Benutzer versucht, einen Primärschlüsselwert zu aktualisieren, wenn bereits ein Fremdschlüssel in einer verwandten Tabelle auf diesen Wert verweist.
- Ein Entwickler vergisst, dass er sich in einem Produktionssystem befindet und beginnt mit der Eingabe von Testdaten direkt in die Datenbank.,
- Ein Hacker schafft es, alle Benutzerkennwörter aus der Datenbank zu stehlen.
- Ein Hacker hackt sich in das Netzwerk und löscht die Datenbank (d. H. löscht sie und alle ihre Daten).
- Ein Feuer fegt durch das Gebäude und brennt den Datenbankcomputer in eine Schlacke.
- Die regelmäßige Sicherung der Datenbank ist in den letzten zwei Monaten fehlgeschlagen…
Es ist nicht schwer, an viele weitere Szenarien zu denken, in denen die Datenintegrität gefährdet ist.,
Viele dieser Risiken können innerhalb der Datenbank selbst angesprochen werden (durch die Verwendung von Datentypen und Einschränkungen für jede Spalte, z. B. Verschlüsselung usw.), während andere durch andere Funktionen des DBMS behoben werden können (z. B. regelmäßige Sicherungen – und Testen, ob die Sicherungen die Datenbank tatsächlich wie erwartet wiederherstellen).
Für einige dieser Faktoren müssen andere (nicht datenbankbezogene) Faktoren vorhanden sein, z. B. ein Offsite-Backup-Speicherort, ein ordnungsgemäß funktionierendes IT-Netzwerk, ordnungsgemäße Schulungen, Sicherheitsrichtlinien usw.,
4 Arten von Datenintegrität
In der Datenbankwelt wird die Datenintegrität häufig in die folgenden Typen unterteilt:
- Entitätsintegrität
- Referentielle Integrität
- Domänenintegrität
- Benutzerdefinierte Integrität
Entitätsintegrität
Entitätsintegrität definiert jede Zeile als eindeutig in ihrer Tabelle. Keine zwei Reihen können gleich sein.
Dazu kann ein Primärschlüssel definiert werden. Das Feld Primärschlüssel enthält eine eindeutige Kennung – keine zwei Zeilen können dieselbe eindeutige Kennung enthalten.,
Referenzielle Integrität
Die referenzielle Integrität betrifft Beziehungen. Wenn zwei oder mehr Tabellen eine Beziehung haben, müssen wir sicherstellen, dass der Fremdschlüsselwert jederzeit mit dem Primärschlüsselwert übereinstimmt. Wir möchten keine Situation haben, in der ein Fremdschlüsselwert keinen übereinstimmenden Primärschlüsselwert in der Primärtabelle hat. Dies würde zu einem verwaisten Datensatz führen.
Die referenzielle Integrität verhindert also, dass Benutzer:
- Datensätze zu einer verwandten Tabelle hinzufügen, wenn in der primären Tabelle kein Datensatz zugeordnet ist.,
- Ändern von Werten in einer primären Tabelle, die zu verwaisten Datensätzen in einer verwandten Tabelle führen.
- Löschen von Datensätzen aus einer primären Tabelle, wenn übereinstimmende zugehörige Datensätze vorhanden sind.
Domänenintegrität
Domänenintegrität betrifft die Gültigkeit von Einträgen für eine bestimmte Spalte. Die Auswahl des entsprechenden Datentyps für eine Spalte ist der erste Schritt zur Aufrechterhaltung der Domänenintegrität. Weitere Schritte könnten das Einrichten geeigneter Einschränkungen und Regeln zum Definieren des Datenformats und/oder das Einschränken des Bereichs möglicher Werte umfassen.,
Benutzerdefinierte Integrität
Benutzerdefinierte Integrität ermöglicht es dem Benutzer, Geschäftsregeln auf die Datenbank anzuwenden, die von keinem der anderen drei Datenintegritätstypen abgedeckt werden.
Schreibe einen Kommentar