Water marteling - 'n Analogie-analoog gaan 'n brug te ver

drupanalise

Data, soos water, kom in baie vorme voor. Die menslike verstand het ontwikkel om die meeste data wat oor ons pad kom, uit te filter, omdat daar eenvoudig soveel van is.

As u u oë en ore oopmaak, is data oral beskikbaar. Die kleur van die muur, die klank van die lugversorging en die reuk van u buurman se koffie word soos 'n humiditeit behandel. Die water is die hele tyd in die lug, maar dit is nie nuttig om daaraan baie aandag te gee nie.

As water in mis saamtrek, dwing dit u om dit te sien en word dit die begrip van die wêreld om u moeiliker. Onvolledige datastelle, beskadigde data, slegte wetenskap, valse gevolgtrekkings en kognitiewe vooroordeel laat jou in die mis verdwaal.

Data val soos reën. As daar net 'n bietjie is, is dit baie onbevredigend - net genoeg om u motor vuil te maak en die gesprek te verwar. U kom voor dat u die vlek op u bril afvee terwyl iemand 'n willekeurige datapunt uitspuit, verkry uit 'n onbekende bron.

  • Verouderde water in 'n vlak dam is gevaarlik. Gegewens, wat uit 'n onbetroubare aanbod versamel word, nie skoongemaak of genormaliseer word nie en laat staan ​​word, kan maklik lei tot foutiewe gevolgtrekkings.
  • A bestendige druppel water kan net genoeg wees om 'n kantien te vul of 'n bosekosisteem te onderhou. Slegs drie datapunte (die aantal e-posse wat gestuur is, geopen, versus geklik) kan 'n bemarkingsprogram volhou.
  • A gesonder vloei data in die vorm van 'n klein spruitjie kan gebruik word om te bad. 'N Deurlopende datavloei maak maatstaf en historiese vergelyking moontlik. Optimering van bestemmingsbladsye kan bereik word met bestendige omskakelingsdata.
    A beskeie rivier kan 'n meule dryf om hout te saag of koring te maal. 'N Aanbeveling-enjin benodig slegs die betroubare bydrae van 'n handjievol sytakke om 'n toename in die waarde van winkelkarre te bied.
  • A waterval 'n groot waterwiel kan dryf en 'n voldoende toevloei van inligting kan 'n intydse, dinamiese inhoudstelsel dryf.
  • A rivier Dit is breed en diep genoeg om 'n hele vervoerbedryf te ondersteun. Genoeg data kan vaartuie en vragskepe dryf in die vorm van 'n versameling koekies van advertensienetwerke, lojaliteitskaartprogramdata-versamelaars en databrokure.

Wanneer data op verwagte tye in verwagte bedrae kom, kan dit vasgelê, gekanaliseer en gebruik word. Besproeiingstelsels, damme en reservoirs bied 'n gevoel van beheer en maak die bou van 'n steeds breër infrastruktuur met kanale, sluise en damme moontlik. Datapakhuise is gebou op minder betroubare vloei.

Netheid is naas godsvrug

Skoon water is van kardinale belang vir die sukses van die lewe, besproeiing, lopende kragstasies, ens. Die definisie van 'skoon' kan vir die doel verander; dit is OK as daar alge in water is wat 'n kragstasie afkoel, en dit is nie aanvaarbaar as daar meer as 10 dele per miljard arseen in drinkwater is nie.

Data is dieselfde. Of u 'n persoon se titel (meneer, mevrou, me.) In 'n direkte-posaansoek het, is van groot belang, tensy u aan dokters pos. Maar vuil data sal u elke keer opspoor.

As Amerikaanse hoof data wetenskaplike, DJ Patil, stel dit op 'n CTO-beraad van die eerste ronde, 'As u nie van plan is om u data skoon te hou van die begin af nie, word u gered. Ek waarborg dit. Om dit na die feit te probeer opruim, sal minstens maande duur. ”

As u water tot kookpunt verhit, kan dit 'n hele industriële rewolusie dryf. Dit lyk asof data dieselfde doen. Vanaf die oomblik dat rekenaars kon stoor sowel as bereken, is data so vinnig versamel as wat die stoorapparaat daarvoor geskep kon word.

Die Data Lake

Terwyl die gegewens van hierdie sytakke deur die meulensjins loop, beland dit alles in die meer, agter die dam. Aangesien data op 'n beheerde wyse uitgelaat word, dryf dit die turbines van die data-industrie aan; daardie reuse-enjins van dataverwerking met name soos Google en Facebook. Hier sal geen droogte wees nie.

En uiteindelik is daar 'n diep waterpoel wat wag vir die ontleder om in te duik. Scuba-toerusting en spiesgeweer in die hand, die ontleder ondersoek die diepte, karteer nuwe grond en ontdek nuwe spesies. Dit is 'n baie opwindende tyd om 'n ontdekkingsreisiger te wees.

Daarom het so baie van hulle vir die eMetrics-beraad sedert 2002. Die volgende geleentheid is in Boston, 27 September tot 1 Oktober 2015.

Registrasie van die top van eMetrie

'N brug te ver

En wat van die krag van data om die volgende Grand Canyon uit te sny? Wat van die gletsersmelting van gestruktureerde data? Hoe behandel ons afvalwater in 'n wêreld wat al hoe meer privaat word?

Dit is vrae vir 'n ander keer en water onder die brug.

Wat dink jy?

Hierdie webwerf gebruik Akismet om spam te verminder. Leer hoe jou opmerking verwerk is.