...
Titel | Eindeutigkeit (Uniqueness) / Doubletten |
Definition | Jedes Objekt muss eindeutig interpretierbar sein. |
Referenz | Objekte, das gegen sich selbst oder sein Gegenstück in einem anderen Objekt gemessen wurde. |
Kennzahl | Erreichungsgrad Eindeutigkeit = 0 - 100% |
Messeinheit | Prozent |
Beispiel | Zwei Objekte (z.B. “Ort & Sehenwürdigkeit”) mit unterschiedlicher SKU unterscheiden sich in allen weiteren Attributen z.B. nur in einem weiteren Merkmal/Attribut (Telefon). SKU 1 -> Telefon = +41 71 274 99 17 Alle weiteren Attribute wie z.B. Name, Vorname, Strasse, PLZ, Ort, sind identisch. Es besteht berechtigter Zweifel, ob es sich hier tatsächlich um zwei unterschiedliche Objekte handelt. Zusätzlich entsteht der Zweifel, ob eines oder sogar keine der Telefonnummer richtig ist. Somit sind beide Objekte nicht mehr eindeutig interpretierbar. |
Beispiel Berechnung | Statt 1000 Objekte ergibt die Doublettenanalyse 960 Objekte. 960 / 1000 x 100 = 96% Eindeutigkeit |
...
Titel | Genauigkeit (Accuracy) | |
Definition | Die Objekte müssen in der jeweils geforderten Exaktheit vorliegen. | |
Referenz | Geschäftsregeln definieren die Kriterien für 100% Genauigkeit. | |
Kennzahl | Erfüllungsgrad Genauigkeit: 0 - 100% | |
Messeinheit | Prozent | |
Beispiel | Es ist vereinbart, dass Zahlenwerte immer mit zwei Stellen hinter dem Komma (####,00)angegeben werden müssen. Ein Datum ist immer in dem Format (tt.mm.jjjj) anzugeben. In Rahmen einer Auswertung wird festgestellt, das Zahlen (z.B. 1000; 500,1) wie auch Datumswerte (z.B. 12.30.2017; 22/06/2017) von der definierten Regel abweichen. Es soll geprüft werden, wie häufig eine Regelverletzung vorliegt. | |
Hinweis | : Im Contentdesk.io werden folgende Attribute automtisch auf Genauigkeit geprüft:
| |
Beispiel Berechnung | Prüfung: Von 1000 Objekten mit dem Attributs "Preis" = 30 Regelverletzungen und des Attributs "Bestelldatum" 10 Regelverletzungen. 1000 - 30 = 970 1000 - 10= 990 |
...
Titel | Redundanzfreiheit (Nonredundant) | |
Definition | Innerhalb der Objekte dürfen keine Dubletten vorkommen. | |
Referenz | Objekte, das gegen sich selbst oder sein Gegenstück in einem anderen Objekten verglichen wurde. | |
Kennzahl | Erfüllungsgrad Redundanzfreiheit = 0 - 100% | |
Messeinheit | Prozent | |
Beispiel | Aus verschiedenen Datenquellen wurden redundant vorgehaltene Kundendaten zusammengeführt. Bei Auswertungen wurde festgestellt, dass die Vereinheitlichung nicht vollständig funktioniert hat. Jede Kundennummer darf nur einmal vorkommen.Aus verschiedenen Datenquellen wurden redundante Objekte zusammengeführt. Bei Auswertungen wruden wurde festgestellt, dass die Vereinheitlichung nicht vollständig funktioniert hat. Jedes Objekte darf nur einmal vorkommen. | |
Beispiel Berechnung | Die Dublettenprüfung ergibt, dass von 1000 Objekte 80 doppelt vorliegen. 1000 - 80 = 920 |
...