Deduplisering: beste praktyke om duplikaat-kliëntedata te vermy of reg te stel

Beste praktyke vir dataduplisering vir CRM

Dubbele data verminder nie net die akkuraatheid van sake-insigte nie, maar dit benadeel ook die kwaliteit wat u kliënte ervaar. Alhoewel almal - IT-bestuurders, sakegebruikers, data-ontleders - die gevolge van duplikaatgegewens ervaar, het dit die ergste impak op die bemarkingsbedrywighede van 'n onderneming. Aangesien bemarkers die produk- en diensaanbod in die bedryf verteenwoordig, kan slegte data u handelsnaam se reputasie vinnig aftakel en negatiewe klanteervarings lewer. Duplikaatdata in die onderneming se CRM vind plaas weens verskillende redes.

Van 'n menslike fout tot klante wat op verskillende tydstip in die organisasie-databasis effens ander inligting verskaf. 'N Verbruiker gee byvoorbeeld sy naam as Jonathan Smith op die een vorm en Jon Smith op die ander. Die uitdaging word vererger deur 'n groeiende databasis. Dit is dikwels moeiliker vir administrateurs om DB by te hou en die relevante data op te spoor. Dit raak al hoe uitdagender om te verseker dat die organisasie se DB akkuraat bly ”.

Natik Ameen, bemarkingskenner by Canz Bemarking

In hierdie artikel gaan ons kyk na die verskillende soorte duplikaatdata, en 'n paar handige strategieë wat bemarkers kan gebruik om die maatskappy se databasisse op te lei.

Verskillende tipes duplikaatdata

Dubbele data word gewoonlik as 'n kopie van die oorspronklike verduidelik. Maar daar is verskillende soorte duplikaatdata wat hierdie probleem ingewikkelder maak.

  1. Presiese duplikate in dieselfde bron - Dit gebeur wanneer rekords van een databron na 'n ander databron oorgedra word sonder om enige ooreenstemmende of samevoegende tegnieke in ag te neem. 'N Voorbeeld kan wees om inligting van CRM na 'n e-posbemarkingsinstrument te kopieer. As u klant op u nuusbrief ingeteken het, is hul rekord reeds in die e-posbemarkingsinstrument beskikbaar, en die oordrag van data vanaf CRM na die instrument sal duplikaatkopieë van dieselfde entiteit skep. 
  2. Presiese duplikate in verskeie bronne - Presiese duplikate in verskeie bronne ontstaan ​​gewoonlik as gevolg van data-rugsteuninisiatiewe by 'n onderneming. Organisasies is geneig om data-suiweringsaktiwiteite te weerstaan ​​en is geneig om alle afskrifte van die data wat hulle beskikbaar het, te stoor. Dit lei tot uiteenlopende bronne wat dubbele inligting bevat.
  3. Wisselende duplikate in verskeie bronne - Duplikate kan ook met verskillende inligting bestaan. Dit kom gewoonlik voor wanneer kliënte veranderings in van, werkstitel, onderneming, e-posadres, ensovoorts. En aangesien daar opvallende verskille tussen ou en nuwe rekords is, word die inkomende inligting as 'n nuwe entiteit beskou.
  4. Nie-presiese duplikate in dieselfde of meerdere bronne - 'n Nie-presiese duplikaat is wanneer 'n datawaarde dieselfde beteken, maar dit op verskillende maniere voorgestel word. Die naam Dona Jane Ruth kan byvoorbeeld gered word as Dona J. Ruth of DJ Ruth. Alle datawaardes verteenwoordig dieselfde, maar as dit vergelyk word deur eenvoudige data-aanpassingstegnieke, word dit as nie-ooreenkomste beskou.

Onttrekking kan 'n baie ingewikkelde proses wees, aangesien verbruikers en ondernemings hul kontakdata mettertyd verander. Daar is verskil in hoe hulle elke veld van data invoer - van hul naam, e-posadres (e), woonadres, besigheidsadres, ens.

Hier is 'n lys van 5 beste praktyke vir die afleiding van data wat bemarkers vandag kan begin gebruik.

Strategie 1: Valideer tjeks op die invoer van data

U moet streng valideringskontroles op alle data-invoerwerwe hê. Dit behels die versekering dat die invoerdata ooreenstem met die vereiste datatipe, formaat en tussen aanvaarbare reekse lê. Dit kan baie help om u data volledig, geldig en akkuraat te maak. Verder is dit van kardinale belang dat u data-invoer-werkvloei nie net ingestel is om nuwe rekords te skep nie, maar dat u eers soek en vind of die datastel 'n bestaande rekord bevat wat ooreenstem met die inkomende. En in sulke gevalle vind en werk dit net op, eerder as om 'n nuwe rekord te skep. Baie maatskappye het tjeks vir die kliënt opgestel om ook hul eie duplikaatdata op te los.

Strategie 2: Voer af met behulp van outomatiese gereedskap

Gebruik selfdiens sagteware vir die ontduiking van data wat u kan help met die identifisering en skoonmaak van gedupliseerde rekords. Hierdie gereedskap kan data standaardiseer, presiese en nie-presiese ooreenkomste te vind, en dit verminder ook die handearbeid om deur duisende rye data te kyk. Maak seker dat die instrument ondersteuning bied vir die invoer van data uit 'n wye verskeidenheid bronne soos Excel-velle, CRM-databasis, lyste, ens.

Strategie 3: gebruik dataspesifieke ontwrigtingstegnieke

Afhangend van die aard van die gegewens, word die ontduiking van data anders gedoen. Bemarkers moet versigtig wees met die aftrek van data, want dieselfde ding kan in verskillende data-eienskappe anders beteken. Byvoorbeeld, as twee datarekords ooreenstem met 'n e-posadres, is dit waarskynlik dat dit duplikate is. Maar as twee verslae op adres ooreenstem, is dit nie noodwendig 'n duplikaat nie, want twee individue wat tot dieselfde huishouding behoort, kan afsonderlike intekeninge by u onderneming hê. Maak dus seker dat u aktiwiteite vir die deduplisering, samesmelting en suiwering van data implementeer volgens die soort data wat u datastelle bevat.

Strategie 4: behaal die goue meesterrekord deur middel van dataverryking

Nadat u die lys van ooreenstemmings in u databasis bepaal het, is dit belangrik om hierdie inligting te ontleed voordat besluite oor die samesmelting of suiwering van data geneem kan word. As daar meerdere rekords bestaan ​​vir 'n enkele entiteit en sommige onakkurate inligting voorstel, is dit die beste om hierdie rekords te suiwer. Aan die ander kant, as duplikate onvolledig is, is die samevoeging van data 'n beter keuse, aangesien dit dataverryking moontlik maak, en saamgevoegde rekords kan meer waarde tot u besigheid toevoeg. 

Hoe dit ook al sy, bemarkers moet werk om 'n enkele siening van hul bemarkingsinligting te kry, genaamd goue meesterrekord.

Strategie 5: Monitor datakwaliteitaanwysers

'N Voortdurende poging om u data skoon en toegewyd te hou, is die beste manier om u strategie vir die toewyding van data uit te voer. 'N Hulpmiddel wat dataprofilering en kwaliteitsbestuurfunksies bied, kan hier van groot nut wees. Dit is noodsaaklik vir bemarkers om dop te hou hoe akkuraat, geldig, volledig, uniek en konsekwent die data is wat vir bemarkingsbedrywighede gebruik word.

Aangesien organisasies voortgaan om datatoepassings by hul sakeprosesse te voeg, het dit vir elke bemarker nodig geword om strategieë vir die deduplisering van data in plek te hê. Inisiatiewe soos die gebruik van instrumente vir die deduplisering van data, en die ontwerp van beter valideringswerkstrome vir die skep en opdatering van datarekords is 'n paar belangrike strategieë wat betroubare datakwaliteit in u organisasie moontlik maak.

Oor Data Ladder

Data Ladder is 'n platform vir bestuur van datakwaliteit wat ondernemings help met die skoonmaak, kategorisering, standaardisering, deduplisering, profilering en verryking van hul data. Ons toonaangewende sagteware vir data-ooreenstemming help u om ooreenstemmende rekords te vind, data saam te voeg en duplikate te verwyder met behulp van intelligente fuzzy matching- en masjienleer-algoritmes, ongeag waar u data woon en in watter formaat.

Laai 'n gratis proeflopie af met data-sagteware vir data-ooreenstemming

Wat dink jy?

Hierdie webwerf gebruik Akismet om spam te verminder. Leer hoe jou opmerking verwerk is.