Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Titel

Eindeutigkeit (Uniqueness) / Doubletten

Definition

Jedes Objekt muss eindeutig interpretierbar sein.

Referenz

Objekte, das gegen sich selbst oder sein Gegenstück in einem anderen Objekt gemessen wurde.

Kennzahl

Erreichungsgrad Eindeutigkeit = 0 - 100%

Messeinheit

Prozent

Beispiel

Zwei Objekte (z.B. “Ort & Sehenwürdigkeit”) mit unterschiedlicher SKU unterscheiden sich in allen weiteren Attributen z.B. nur in einem weiteren Merkmal/Attribut (Telefon).

SKU 1 -> Telefon = +41 71 274 99 17
SKU 2 -> Telefon = +41 71 274 99 19

Alle weiteren Attribute wie z.B. Name, Vorname, Strasse, PLZ, Ort, sind identisch.

Es besteht berechtigter Zweifel, ob es sich hier tatsächlich um zwei unterschiedliche Objekte handelt. Zusätzlich entsteht der Zweifel, ob eines oder sogar keine der Telefonnummer richtig ist. Somit sind beide Objekte nicht mehr eindeutig interpretierbar.

Beispiel Berechnung

Statt 1000 Objekte ergibt die Doublettenanalyse 960 Objekte.

960 / 1000 x 100 = 96% Eindeutigkeit

...

:

Titel

Genauigkeit (Accuracy)

Definition

Die Objekte müssen in der jeweils geforderten Exaktheit vorliegen.

Referenz

Geschäftsregeln definieren die Kriterien für 100% Genauigkeit.

Kennzahl

Erfüllungsgrad Genauigkeit: 0 - 100%

Messeinheit

Prozent

Beispiel

Es ist vereinbart, dass Zahlenwerte immer mit zwei Stellen hinter dem Komma (####,00)angegeben werden müssen. Ein Datum ist immer in dem Format (tt.mm.jjjj) anzugeben.

In Rahmen einer Auswertung wird festgestellt, das Zahlen (z.B. 1000; 500,1) wie auch Datumswerte (z.B. 12.30.2017; 22/06/2017) von der definierten Regel abweichen.

Es soll geprüft werden, wie häufig eine Regelverletzung vorliegt. 

Hinweis

Im Contentdesk.io werden folgende Attribute automtisch auf Genauigkeit geprüft:

  • Telefon

  • E-Mail

  • Webseite = URL

Beispiel Berechnung

Prüfung: Von 1000 Objekten mit dem Attributs "Preis" = 30 Regelverletzungen und des Attributs "Bestelldatum" 10 Regelverletzungen.

1000 - 30 = 970
970 / 1000 x 100 = 97% Genauigkeit "Preis"

1000 - 10= 990
990 / 1000 x 100 = 99% Genauigkeit "Bestelldatum"

...

Aus verschiedenen Datenquellen wurden redundant vorgehaltene Kundendaten zusammengeführt. Bei Auswertungen wurde festgestellt, dass die Vereinheitlichung nicht vollständig funktioniert hat. Jede Kundennummer darf nur einmal vorkommen.

Titel

Redundanzfreiheit (Nonredundant)

Definition

Innerhalb der Objekte dürfen keine Dubletten vorkommen.

Referenz

Objekte, das gegen sich selbst oder sein Gegenstück in einem anderen Objekten verglichen wurde.

Kennzahl

Erfüllungsgrad Redundanzfreiheit = 0 - 100%

Messeinheit

Prozent

Beispiel

Aus verschiedenen Datenquellen wurden redundante Objekte zusammengeführt. Bei Auswertungen wruden wurde festgestellt, dass die Vereinheitlichung nicht vollständig funktioniert hat. Jedes Objekte darf nur einmal vorkommen.

Beispiel Berechnung

Die Dublettenprüfung ergibt, dass von 1000 Objekte 80 doppelt vorliegen.

1000 - 80 = 920
920 / 1000 x 100 = 92% Redundanzfreiheit

...