Salesforceのデータ品質を維持する方法|入力規則から自動チェックまで
AI・テクノロジー25分で読めます

Salesforceのデータ品質を維持する方法 | 入力規則から自動チェックまで

ailead編集部

ailead編集部

「Salesforceのデータが信頼できない」という課題

Salesforceを導入したものの、レポートの数値を誰も信用しない。結局、営業担当者がExcelで独自のデータを管理し、マネージャーは会議のたびにスプレッドシートを要求する。この状況は、Salesforce導入企業で頻繁に見られる課題です。原因はシステムの問題ではなく、データ品質を維持する仕組みがないことにあります。データ品質は担当者の意識や努力だけでは守れません。入力ルールの設定、重複の自動検出、定期的なクレンジングといった仕組みを段階的に整備することで、Salesforceのデータを「業務判断に使える品質」に保てます。この記事では、データ品質を「予防」「検出」「修正」の3段階で管理するアプローチを解説します。

データ品質の3段階アプローチ

データ品質管理は、以下の3段階で構成します。

段階目的主な手段
予防不正データの流入を止める入力規則、必須フィールド、重複管理
検出問題のあるデータを見つけるレポート、ダッシュボード
修正既存の不良データをクレンジングするData Loader、sf CLI

多くの組織では「修正」から着手しがちですが、予防策なしにクレンジングを行っても、同じ品質問題が繰り返し発生します。まず予防策を整備し、検出の仕組みを構築し、そのうえで既存データの修正に取り組むのが効率的です。

予防策1: 入力規則(Validation Rule)

入力規則は、レコードの保存時に指定した条件をチェックし、条件に違反する場合にエラーを表示して保存を阻止する機能です。Setup > Object Manager > 対象オブジェクト > Validation Rules から設定します。

よく使う入力規則パターン

用途数式(Error Condition)説明
メールアドレス形式NOT(REGEX(Email, "^[a-zA-Z0-9._-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,}$"))不正な形式のメールを拒否
金額が0以上Amount < 0マイナス金額の入力を防止
電話番号フォーマットNOT(REGEX(Phone, "^0\\d{1,4}-?\\d{1,4}-?\\d{3,4}$"))日本の電話番号形式をチェック
日付の論理チェックCloseDate < CreatedDateクローズ日が作成日より前の場合にエラー

入力規則を設計する際に注意すべき点は、ルールの数を絞ることです。入力規則が多すぎるとユーザーの入力体験が著しく悪化し、「Salesforceに入力するのが面倒」という認識が広まります。本当にデータ品質に影響する項目に限定し、ビジネス上のインパクトが大きいものから順に導入してください。

予防策2: 必須フィールド設計

Salesforceの必須フィールドには、オブジェクトレベルとレイアウトレベルの2種類があります。

種類適用範囲APIからの登録
オブジェクトレベル必須全ルート(UI、API、インポートすべて)空は不可
レイアウトレベル必須UI入力のみ空でも通る

外部システムからAPI経由でデータを登録するケースがある場合は、オブジェクトレベルでの必須設定を推奨します。レイアウトレベルの必須はUIからの入力にしか効かないため、APIルートで空データが流入するリスクがあります。

ただし、商談のように段階的に情報が充実するオブジェクトでは、全フィールドを最初から必須にすると運用が回りません。この場合は、Validation Ruleとステージフィールドを組み合わせて「提案ステージ以降は見積金額が必須」のような段階的必須を実現します。

予防策3: 重複管理

Salesforceの重複管理は、「一致ルール(Matching Rule)」と「重複ルール(Duplicate Rule)」の2つで構成されます。

一致ルールは、どのフィールドの組み合わせで重複を判定するかを定義します。完全一致だけでなく、ファジーマッチ(あいまい一致)にも対応しています。取引先の重複検出には「会社名のファジーマッチ + メールドメインの完全一致」の組み合わせが実用的です。「株式会社ABC」と「ABC株式会社」のような表記ゆれも検出できます。

重複ルールは、重複が検出された際のアクションを定義します。選択肢は「警告して保存を許可」か「ブロック(保存を拒否)」の2つです。営業チーム向けには「警告して保存を許可」を推奨します。ブロック設定にすると、急いで取引先を登録したい営業担当者が入力を放棄してしまうリスクがあるためです。警告を表示したうえで、重複の可能性がある場合はマージを促す運用が現実的です。

検出: データ品質監視レポート

予防策を講じていても、データの経年劣化は避けられません。定期的にデータ品質を監視するレポートを作成し、問題を早期に発見する仕組みが必要です。

監視すべき指標

指標フィルタ条件確認頻度
空白フィールド率Email equals ""週次
データ鮮度LastModifiedDate < LAST_N_DAYS:90月次
異常値Amount greater than 100000000週次
重複レコード数重複レポート(標準機能)月次

これらの指標をダッシュボードにまとめ、「データ品質スコア」として可視化します。空白率、重複率、鮮度のそれぞれに目標値を設定し、閾値を下回った場合にアラートを出す運用が効果的です。

修正: データクレンジングの手順

既存の不良データを修正する際は、以下の手順で進めます。

  1. クレンジング対象レポートの作成: 空白フィールド、異常値、重複レコードを抽出するレポートを作成
  2. バックアップの取得: Data Loaderでエクスポートし、修正前のデータを保存
  3. クレンジングデータの準備: CSVファイルに修正後のデータを準備
  4. テスト環境での検証: Sandboxで一括更新を実行し、結果を確認
  5. 本番環境への適用: 問題がなければ本番環境で実行

sf CLIを使った一括更新の例を示します。

sf data bulk upsert \
  --sobject Account \
  --file clean_data.csv \
  --external-id Id \
  --target-org myOrg \
  --wait 10

一度に大量のレコードを更新する場合は、1,000件単位でバッチを分割し、段階的に実行することをお勧めします。万が一問題が発生した場合に、影響範囲を限定できます。

外部データ連携時の品質管理

BigQueryやプロダクトDBなど、外部システムからSalesforceにデータを連携する場合、パイプライン側に異常検知ロジックを組み込むことが重要です。ソースデータに障害が発生した状態でSalesforceに書き込むと、壊れたデータで正常なデータを上書きしてしまいます。

異常検知の主要パターン

検知条件想定原因対処
行数が前日比50%以上減少データソース障害、エクスポートエラー書き込みスキップ
アクティブユーザーの30%超が突然0にエクスポート遅延、集計タイミングのずれ書き込みスキップ
NULLスコアが全体の50%超スコアリングロジックエラー書き込みスキップ

異常を検知した場合は、Salesforceへの書き込みをスキップし、前回の正常なデータをそのまま保持します。「古いが正確なデータのほうが、新しいが壊れたデータより価値がある」という設計思想です。

パイプラインの実行ログは別テーブルに記録し、異常発生時の原因究明に活用します。ログには実行日時、処理件数、スキップ有無、検知した異常の内容を残しておくと、障害の切り分けが容易になります。

Data Quality Flagの運用

外部連携データの信頼性をSalesforce上で可視化するために、各レコードにData Quality Flagフィールド(カスタム選択リスト)を設置する方法があります。

フラグ値意味
OK正常全データソースが正常に連携された状態
PG_ERRORソースDB障害プロダクトDBからのデータ取得に失敗
GA_DELAY分析データ遅延GA4データの反映が遅延している状態

レポートやダッシュボードで OK 以外のレコードをフィルタすることで、営業担当者やマネージャーが「このデータは現在信頼性が低い」と判断できます。フラグは連携パイプラインが自動的に更新するため、手動での運用負荷はかかりません。

まとめ

Salesforceのデータ品質は「予防」「検出」「修正」の3段階で管理します。入力規則で不正データの流入を防ぎ、必須フィールドとステージ連動のValidation Ruleで段階的な入力品質を担保します。重複管理では、営業チームの入力体験を損なわないよう「警告して保存を許可」を基本とし、定期的なレポートでデータの空白率、鮮度、異常値を監視します。外部システムとの連携では、パイプラインに異常検知ロジックを組み込み、壊れたデータがSalesforceに流入するのを防ぎます。Data Quality Flagを活用すれば、レコード単位でデータの信頼性を可視化できます。これらの仕組みを段階的に導入することで、「Salesforceのデータが信頼できない」という課題を解消し、データに基づいた業務判断を組織全体で進められるようになります。

aileadのデータ品質へのアプローチ

aileadでは、BigQueryからSalesforceへの日次データ連携パイプラインに5つの異常検知チェックを組み込み、壊れたデータがSalesforceに流入するのを防止しています。「古いが正確なデータのほうが、新しいが壊れたデータより価値がある」という設計思想のもと、異常検知時にはSalesforceへの書き込みを自動的にスキップし、前回の正常なデータを保持する仕組みを運用しています。Salesforceのデータ品質やデータ連携についてご相談がありましたら、お問い合わせからお気軽にご連絡ください。

関連記事

ailead編集部

ailead編集部

株式会社ailead

aileadの公式編集部です。営業DX・AI活用に関する情報を発信しています。

#Salesforce管理#Salesforce開発#データ連携

ailead(エーアイリード)で商談・面談データを活用しませんか?

AIが商談を自動で記録・分析し、営業組織の生産性を向上させます