Zum Inhalt springen

Uniqueness

Uniqueness misst, ob Feldwerte über Datensätze hinweg eindeutig sind. Hohe Uniqueness bedeutet, dass jeder Datensatz einen anderen Wert für das Feld hat — niedrige Uniqueness weist auf Duplikate hin.

Für jedes Feld führt die Uniqueness-Strategie folgende Schritte aus:

  1. Sammelt alle nicht-null-Werte über Datensätze im Umfang
  2. Identifiziert doppelte Werte
  3. Berechnet: (eindeutige Werte / gesamt befüllte Werte) × 100

Der Abschnitt Defaults steuert globale Uniqueness-Optionen:

EinstellungBeschreibung
Case-sensitive matchingWenn aktiviert, werden „John Smith” und „john smith” als verschiedene Werte für den Vergleich betrachtet. Wenn deaktiviert, zählen sie als Duplikate.
Include blanks in uniqueness checksWenn aktiviert, werden leere und null-Werte als eigenständige Werte in den Vergleichsberechnungen behandelt.

Die Tabelle Field Overrides darunter listet jedes Feld mit seinen aktuellen Einstellungen für Case Sensitive, Include Blanks und Status auf.

Uniqueness-Konfiguration mit Defaults (Matching Options, Blank Handling) und Feld-Überschreibungstabelle

Klicken Sie auf ein Feld in der Field Overrides-Tabelle, um dessen Konfigurationsmodal zu öffnen. Sie können Case-sensitive matching und Include blanks in uniqueness checks unabhängig von den globalen Standards umschalten. Verwenden Sie den Link Revert to Global, um das Feld auf die globalen Einstellungen zurückzusetzen.

Feldspezifisches Konfigurationsmodal für das Feld Phone mit Case Sensitivity- und Blank Handling-Optionen

ErgebnisBewertung
Alle Werte eindeutig100
Einige DuplikateProportional zum Prozentsatz eindeutiger Werte
Alle Werte identischNahe 0
Keine Daten0

Die Uniqueness-Analyse verarbeitet bis zu 40.000 Datensätze pro Scan. Bei Objekten mit mehr Datensätzen spiegeln die Ergebnisse eine repräsentative Stichprobe wider. Dieses Limit existiert, um einen Salesforce Heap-Memory-Overflow zu verhindern, da die Engine eine In-Memory-Map der Wertzählungen pro Feld erstellt. Felder, die 40.000 verschiedene Werte überschreiten, werden als Felder mit hoher Kardinalität markiert.

Uniqueness ist am aussagekräftigsten für:

  • Email — sollte pro Kontakt/Lead eindeutig sein
  • Phone — oft eindeutig pro Person
  • External IDs — müssen per Definition eindeutig sein
  • Textfelder — Namen, Beschreibungen

Weniger aussagekräftig für:

  • Boolean — nur zwei mögliche Werte
  • Picklist — begrenzte Wertmenge durch Design
  • Date — viele Datensätze können Daten teilen
  • Doppelte E-Mail-Adressen über Contacts oder Leads erkennen
  • Überprüfen, ob External ID-Felder wirklich eindeutig sind
  • Dateneingabeprobleme identifizieren, bei denen derselbe Wert über Datensätze kopiert wird
  • Deduplizierungsbemühungen über die Zeit überwachen