Water marteling - 'n Analogie-analoog gaan 'n brug te ver

drupanalise

Data, soos water, kom in baie vorme voor. Die menslike verstand het ontwikkel om die meeste data wat oor ons pad kom, uit te filter, omdat daar eenvoudig soveel van is.

As u u oë en ore oopmaak, is data oral beskikbaar. Die kleur van die muur, die klank van die lugversorging en die reuk van u buurman se koffie word soos 'n humiditeit behandel. Die water is die hele tyd in die lug, maar dit is nie nuttig om daaraan baie aandag te gee nie.

As water in mis saamtrek, dwing dit u om dit te sien en word dit die begrip van die wêreld om u moeiliker. Onvolledige datastelle, beskadigde data, slegte wetenskap, valse gevolgtrekkings en kognitiewe vooroordeel laat jou in die mis verdwaal.

Data val soos reën. As daar net 'n bietjie is, is dit baie onbevredigend - net genoeg om u motor vuil te maak en die gesprek te verwar. U kom voor dat u die vlek op u bril vee, terwyl iemand 'n willekeurige datapunt uitspuit, verkry uit 'n onbekende bron.

  • Verouderde water in 'n vlak dam is gevaarlik. Gegewens, wat uit 'n onbetroubare aanbod versamel word, nie skoongemaak of genormaliseer word nie en laat staan ​​word, kan maklik lei tot foutiewe gevolgtrekkings.
  • A bestendige druppel water kan net genoeg wees om 'n kantien te vul of 'n bosekosisteem te onderhou. Slegs drie datapunte (die aantal e-posse wat gestuur is, geopen, versus geklik) kan 'n bemarkingsprogram volhou.
  • A gesonder vloei data in die vorm van 'n klein spruitjie kan gebruik word om te bad. 'N Deurlopende datavloei maak maatstaf en historiese vergelyking moontlik. Optimering van bestemmingsbladsye kan bereik word met bestendige omskakelingsdata.
    A beskeie rivier kan 'n meule dryf om hout te saag of koring te maal. 'N Aanbeveling-enjin benodig slegs die betroubare bydrae van 'n handjievol sytakke om 'n toename in die waarde van winkelkarre te bied.
  • A waterval 'n groot waterwiel kan dryf en 'n voldoende toevloei van inligting kan 'n intydse, dinamiese inhoudstelsel dryf.
  • A rivier dit is breed en diep genoeg om 'n hele vervoerbedryf te ondersteun. Voldoende data kan vaartuie en vragskepe dryf in die vorm van 'n versameling koekies van advertensienetwerke, data-versamelaars van lojaliteitskaartprogramme en data-makelaars.

Wanneer data op verwagte tye in verwagte bedrae kom, kan dit vasgelê, gekanaliseer en gebruik word. Besproeiingstelsels, damme en reservoirs bied 'n gevoel van beheer en maak die bou van 'n steeds breër infrastruktuur met kanale, sluise en damme moontlik. Datapakhuise is gebou op minder betroubare vloei.

Netheid is naas godsvrug

Skoon water is van kardinale belang vir die sukses van die lewe, besproeiing, lopende kragstasies, ens. Die definisie van 'skoon' kan vir die doel verander; dit is OK as daar alge in water is wat 'n kragstasie afkoel, en dit is nie aanvaarbaar as daar meer as 10 dele per miljard arseen in drinkwater is nie.

Data is dieselfde. Of u 'n persoon se titel (meneer, mevrou, me.) In 'n direkte e-pos-aansoek het, is van groot belang, tensy u per pos aan dokters stuur. Maar vuil data sal u elke keer opspoor.

As Amerikaanse hoof data wetenskaplike, DJ Patil, stel dit op 'n CTO-beraad van die eerste ronde: 'As u nie van plan is om u data van die begin af skoon te hou nie, word u gered. Ek waarborg dit. Om dit na die feit te probeer opruim, sal minstens maande duur. ”

As u water tot kookpunt verhit, kan dit 'n hele industriële rewolusie dryf. Dit lyk asof data dieselfde doen. Vanaf die oomblik dat rekenaars kon stoor sowel as bereken, is data so vinnig versamel as wat die stoorapparaat daarvoor geskep kon word.

Die Data Lake

Terwyl die gegewens van hierdie sytakke deur die meulensjins loop, beland dit alles in die meer, agter die dam. Aangesien data op 'n beheerde wyse uitgelaat word, dryf dit die turbines van die data-industrie aan; daardie reuse-enjins van dataverwerking met name soos Google en Facebook. Hier sal geen droogte wees nie.

Uiteindelik is daar 'n diep poel water wat wag vir die ontleder om in te duik. Scuba-toerusting en spiesgeweer in die hand, die ontleder ondersoek die diepte, karteer nuwe grond en ontdek nuwe spesies. Dit is 'n baie opwindende tyd om 'n dataverkenner te wees.

Daarom het soveel van hulle vir die eMetrics Summit sedert 2002. Die volgende geleentheid is in Boston, 27 September tot 1 Oktober 2015.

Registrasie van die top van eMetrie

'N brug te ver

En wat van die krag van data om die volgende Grand Canyon uit te sny? Wat van die gletsersmelting van gestruktureerde data? Hoe behandel ons afvalwater in 'n wêreld wat al hoe meer privaat word?

Dit is vrae vir 'n ander keer en water onder die brug.

Wat dink jy?

Hierdie webwerf gebruik Akismet om spam te verminder. Leer hoe jou opmerking verwerk is.