コンテンツにスキップ

Uniqueness

Uniquenessは、項目の値がレコード間で一意であるかを測定します。高いUniquenessは各レコードがその項目で異なる値を持つことを意味し、低いUniquenessは重複があることを示します。

各項目に対して、Uniquenessストラテジーは以下を実行します:

  1. スコープ内のレコードからすべてのnullでない値を収集
  2. 重複値を識別
  3. 計算:(一意の値 / 入力済みの値の合計) × 100

Defaultsセクションでは、グローバルなUniquenessオプションを制御します:

設定説明
大文字・小文字を区別するマッチング有効にすると、「John Smith」と「john smith」は比較時に異なる値とみなされます。無効にすると、重複としてカウントされます。
空白をUniquenessチェックに含める有効にすると、空白やnull値は比較計算で個別の値として扱われます。

下部のField Overridesテーブルには、各項目の現在のCase Sensitive、Include Blanks設定、およびステータスがリストされます。

Uniquenessの構成 — Defaults(Matching Options、Blank Handling)とField Overridesテーブル

Field Overridesテーブルで項目をクリックすると、構成モーダルが開きます。グローバルデフォルトとは独立して大文字・小文字を区別するマッチング空白をUniquenessチェックに含めるを切り替えることができます。Revert to Globalリンクを使用して項目をグローバル設定にリセットできます。

Phone項目の項目ごとの構成モーダル — Case SensitivityとBlank Handlingオプション

結果スコア
すべての値が一意100
一部に重複あり一意の割合に比例
すべての値が同一0に近い
データなし0

Uniqueness分析はスキャンあたり最大40,000レコードを処理します。レコード数がそれ以上のオブジェクトの場合、結果は代表的なサンプルを反映します。この制限は、エンジンが項目ごとの値カウントのインメモリマップを構築するため、Salesforceのヒープメモリオーバーフローを防ぐために存在します。40,000を超える個別の値を持つ項目は、高カーディナリティ項目としてフラグされます。

Uniquenessが最も意味を持つのは:

  • Email — コンタクト/リードごとに一意であるべき
  • Phone — 個人ごとに一意であることが多い
  • 外部ID — 定義上一意でなければならない
  • テキスト項目 — 名前、説明

あまり意味がないもの:

  • Boolean — 2つの値しかない
  • Picklist — 設計上限られた値セット
  • Date — 多くのレコードが同じ日付を共有する可能性がある
  • ContactやLeadの重複メールアドレスを検出
  • 外部ID項目が本当に一意であることを検証
  • 同じ値がレコード間でコピーされるデータ入力の問題を特定
  • 重複排除の取り組みを経時的に監視