Pular para o conteúdo

Capacidades de Qualidade

O Data Quality Sense avalia seus dados em 6 dimensoes de qualidade distintas (capacidades). Cada dimensao foca em um aspecto diferente da qualidade dos dados e produz pontuacoes independentes que se consolidam em uma classificacao geral de qualidade.

Completeness

Mede se os campos contem valores. Detecta dados nulos, em branco e ausentes nos campos selecionados. Saiba mais →

Validity

Verifica se os valores estao em conformidade com formatos, intervalos e padroes esperados. Suporta validacao de picklist e correspondencia de regex. Saiba mais →

Uniqueness

Identifica valores duplicados entre registros. Sinaliza campos onde valores unicos sao esperados, mas duplicatas existem. Saiba mais →

Timeliness

Avalia se os dados estao atualizados. Mede a atualidade com base em janelas de tempo configuraveis. Saiba mais →

Consistency

Verifica a consistencia logica entre campos relacionados. Detecta contradicoes como uma data de fechamento anterior a uma data de abertura. Saiba mais →

PII Detection

Varre campos de texto livre em busca de informacoes pessoais identificaveis. Auxilia na conformidade com privacidade de dados. Saiba mais →

Cada capacidade produz uma pontuacao de 0 a 100 para cada campo varrido:

  • 100 — Qualidade perfeita para esta dimensao
  • 75-99 — Bom, com problemas menores
  • 50-74 — Qualidade moderada, atencao recomendada
  • 0-49 — Qualidade ruim, acao necessaria
  • 0 — Sem dados para medir (por exemplo, todos os campos vazios)

As pontuacoes sao agregadas:

  1. Pontuacao do Campo — Resultado individual do campo por capacidade
  2. Pontuacao da Dimensao — Media entre todos os campos para uma capacidade
  3. Pontuacao da Definicao — Media ponderada entre todas as dimensoes

Nem todas as capacidades se aplicam a todos os tipos de campos. O DQS lida automaticamente com combinacoes nao aplicaveis:

Tipo de CampoCompletenessValidityUniquenessTimelinessConsistencyPII Detection
Text
Number
Date
Picklist
Boolean
Email
Phone