Tutti i progetti di integrazione e migrazione dei dati trattano dati provenienti da ambienti eterogenei, gestiti ognuno con logiche di business specifiche dell’area funzionale e dominio a cui appartengono. Per riconciliare questi dati è necessario implementare un set di funzioni finalizzate a standardizzare, trasformare ed arricchire i dati sorgenti in modo da renderli uniformi e, quindi, memorizzarli e confrontarli in modo coerente.

Trillium Software Quality (TSQ) mette a disposizione due modelli di progetto con cui processare dati al fine di migliorarne la qualità:

  • Name and Address Project: è un modello specifico per trattare dati di anagrafica persone ed indirizzi.

I sistemi applicativi sono sensibili alla localizzazione geografica ed alla lingua. Per essi è necessario corredare la piattaforma Trillium Software Quality di dizionari e librerie propri al paese ed alla zona geografica (Country Project Template e Postal File). Il workflow del processo prevede i passi caratteristici di trasformazione, parsing, validazione dei dati postali, ricerca dei duplicati, consolidamento dei dati.

Trillium Software® Global Locator fornisce dati accurati e consistenti sulla localizzazione geografica; è dotato di algoritmi per la validazione degli indirizzi e la standardizzazione ed arricchimento dei dati postali.

La geocodifica assegna i valori di latitudine e longitudine di un indirizzo. La precisione delle coordinate assegnate dipende dall’accuratezza dell’indirizzo stesso: esatto, di prossimità, centrato sulla località cui appartiene l’indirizzo.

 

  • Business Data Project (BDP): è un modello specifico per trattare dati non anagrafici. Il workflow di default del processo non prevede la validazione postale. Identifica, verifica e standardizza campi che, in forma di testo libero, contengono i dati relativi ad oggetti di business (prodotti, componenti, servizi, brands). L’analisi del testo è fatta utilizzando dizionari in cui si inseriscono le parole, le frasi chiave, i pattern descrittivi della grammatica associata alla definizione di un oggetto. Tali dizionari possono essere creati e personalizzati in relazione alle specifiche esigenze di business.

Il potente e nativo processo di deduplica di TS Quality, propriamente detto Relationship Linking, confronta i records di flat files, di un database, o di più database,  determina le somiglianze e “collega” i records tra loro simili (scoperta delle prossimità).