zitiz.se
Den här sajten är en del av Zitiz

Räkna med superstatistik

Google är ett av exemplen på hantering av våldsamt stora datamängder. Stor men billig datakraft är nyckeln till räddade liv i sjukvården, bättre förutsägelser om vin- och flygpriser samt bästsäljande boktitlar. Räkna med en stor framtid för – beräkningar!

Google är ett företag fyllt av data med stora parker av dataservrar. PageRank är nyckeln till hur sökresultaten rangordnas, nämligen efter hur ”populära” dvs. hur ofta länkade webbsidor är. Ser man på företagets utveckling så ser man ett frenetiskt jagande efter nya källor till – data. Som förstås skall bli affärer. Rekryteringskampanjerna utmärker sig av gåtor som pekar på intresset, ja fixeringen vid algoritmer, vid räknemönster.


Boken ”Super Crunchers” av den ytterst seriöse Yale-professorn Ian Ayres är långt ifrån den lättsinniga samling kåserier som omslagscitatet fällt av Freakonomics-författaren Steven Levitt låter förmoda. Nej, det är en tung, faktaspäckad men också pedagogisk genomgång av ett antal av de möjligheter som tillgång till stora datamängder med stark datakraft skapar. Påbyggnadsartiklar av Ayres själv (bl a på Freakonomics blogg) och andra, t ex i Wired, visar på ett fält bara i början av sin utveckling.


Boken börjar dock med ett roligt exempel som förleder läsaren att förmoda att boken blir ”något åt kåserihållet”. En annan professor, Orley Ashenfelter på Princeton, väletablerad nationalekonom, har haft fräckheten att reducera vinprovning till – en algoritm. En formel, nämligen för Bordeaux Vinkvalitet = 12,145 + 0,00117x(vinterns regnmängd) + 0,0614x(medeltemperatur under växtsäsongen) – 0,00386x(skörderegnmängd). Med något fler faktorer kan han göra exakta förutsägelser för vinkvaliteten från mer än hundra vinslott. Vinprofeterna är, förutsägbart nog, upprörda.

Den berömde Robert Parker, som försäkrat sin näsa för miljonbelopp (i dollar), kallar Ashenfelter en ”fullständig skojare”, ”med en Neanderthalares sätt att se på vin, så absurt att det är att skrattretande”. Det är bara det att Ashenfelters spådomar vid senare vinauktioner visat sig slå rätt – mer rätt än Parkers näsbestämda bedömningar. Tre månader efter skörden 1989 spådde han att detta skulle bli århundradets vin – och han skulle komma att få rätt…


Ayres pekar på en del sociala problem med att räkna på och därmed ”förutse” allt. Det finns våldsamt stora samlingar av persondata (företaget Acziom har 850 Tbyte) som gör det möjligt att skapa ett hundratal marknads-, livsstils- eller beteendenischer. Det kan leda till mer av diskriminering i det fördolda – samtidigt som författaren visar hur det kan användas för att avslöja och belägga diskriminering. När ett företag tackar för att man varit så trogen och därför erbjuder något gratis, ja, då har man betalat för mycket tidigare. En spelare som förlorat så mycket att hon är på väg att ge upp får en fri drink och hålls borta från spelandet en stund…

Vissa räknar på risker för att kortinnehavare skall skilja sig, detta för att de då blir sämre risker för finansföretaget. Men det går att vända på kuttingen, som Erin Etzioni gjorde när han upptäckte att han fått betala mycket mer för sin flygbiljett än resenären i grannstolen. Etzioni utvecklade Farecast, ett system för att, baserat på historiska data en masse, förutsäga flygpriser. Detsamma finns för fastigheter (fast hur det stämde när bubblan brast har jag inte kollat; Zillow.com bygger på cirka 70 miljoner huspriser).


Med kraftfulla vägar till databearbetning blir det lättare att testa olika framgångsvägar – från medicinska preparat till webbannonser. Ett kreditföretag testade erbjudanden med mellan 3,25 och 11,75 procents ränta och mycket riktigt var lägre ränta mer attraktivt. Men om det i brev till manliga potentiella låntagare fanns ett foto av en leende kvinna så hade det samma effekt som en räntesänkning med 4,5 procent. Ayres använde metoden för att bestämma vilken titel hans bok skulle få. Själv trodde han på ”The End of Intuition” men ”Super Crunchers” vann överlägset, med 63 procent fler klickar. Från mer än en kvarts miljon sidbetraktningar på Internet…


Det verkliga paradkapitlet handlar om EBM, evidence based medicine. Som så ofta finns det en person bakom, Don Berwick, tagen dels av statistiken som sa att 98 000 människor dog i onödan på amerikanska sjukhus, dels av hur hans fru som visade sig lida av en ovanlig immunsjukdom behandlades. I slutet av 2004 startade han kampanjen ”rädda 100 000 liv på 18 månader”. De åtgärder han närmast tjatade om var inte särskilt avancerade men väl belagda om någon bara gjorde som han: granskade statistiken, forskningen. Som t ex pekade på vikten av att – tvätta händerna. De sjukhus som deltog i kampanjen som omfattade sex åtgärder varav handtvätt var en behövde inte åta sig alla sex åtgärderna men väl ge dödsfallsstatistik 18 månader före och för de 18 månaderna av kampanj. Jämförelsen pekade på mer än 120 000 sparade liv.
Boken introducerar pedagogiskt nyckelbegrepp som regressionsanalys, standardavvikelser och neurala nätverk. De senare är ett alternativ till att söka regressioner och explicita algoritmer – idén kommer från forskning om artificiell intelligens, försök att få datorer att tänka och lära sig som människor. Med massor av data kan datorn ”lära sig” att se mönster. På en högskola tränade man t ex en dator att förstå vilka hundar som vann i hundkapplöpningar. Över ett antal lopp förlorade ett lag på tre experter 60 dollar, datorn vann 125. Baksidan är att nätverket är ogenomskådligt: vilka och var återfinns effekterna av ett enskilt inmatat faktum? Det finns heller inga sannolikheter som säger att resultatet blir si eller så med säg 95 procents sannolikhet.


Dick Copaken och företaget Epagogix arbetar inte med boktitlar och algoritmer utan med filmmanus och neurala nätverk. Det visar sig att manusinnehåll ger en mycket god möjlighet att se vilka intäkter en film skall generera – alltså inte valet av skådespelare, regissör etc. Metoden är inte perfekt (än?), men den klarade av att spå rätt för sex filmer av nio, med föga felmarginal. Extrapolerar man som Ayres handlar det om någon miljard dollar per år för ett stort filmbolag. Dessutom kan man avläsa effekterna av olika ändringar i manus, kostsamma eller ej, och, om det kostar, vad avkastningen blir. I nästa steg kan man ta med även filmstjärnor och regissörer, men dessa spelar alltså föga roll och förlorar en hel del av sina förhandlingsövertag. Men stjärnorna kan nyttja systemet för att bestämma sådant som om de skall få ett fast gage eller en andel av vad den totala publiken betalar. Det visade sig att många filmbolag struntade i resultaten eftersom det skulle reta så många av deras normala kompisar – och det skapar stort utrymme för den mindre hänsynsfulle…


Oväntat spännande kanske, och poängfylld, är Ayres redogörelse för en vetenskaplig fejd han haft (och har?) med John Lott. Lott har under diverse pseudonym kritiserat Ayres och berömt sig själv på Internet. Striden gäller effekten av om man tillåter dolda handeldvapen, en het politisk fråga i USA, där båda forskarna, Ayres och Lott, och deras resultat blivit viktiga argument i en förbuds-tillstånds-debatt. Lott har varit den korrekte vetenskapsmannen i det att han ställt sin stora databas till vilka som helst andra forskares förfogande. När Ayres och hans kollega kollade fann de för det första att små ändringar i regressionsekvationen eliminerade de effekter Lott funnit, för det andra och värre, viktiga parametrar råkade av dataprogrammet sättas till noll. Med korrekta värden blev resultatet det motsatta mot vad Lott funnit. Mer än tio forskare ytterligare har utnyttjat databasen och USAs vetenskapsakademi sammanfattade med att data inte gav något klart utslag.


Näringsliv

Sluta snacka om innovation och börja gör något!

En artikel i tidningen Fast Company av Aaron Shapiro tar upp ett ämne som stämmer mycket väl med företagandet i Dalarna. Mycket snack men lite verkstad.
Idag är alla företag utsatta för risken att de blir utkonkurrerade av ett nystartat företag, här eller på andra sidan jordklotet. Många företag pratar därför om hur svårt det är, men få gör något konkret. Det är för att de anställda får betalt för och strukturen i företagen är uppbyggd för att behålla status quo.

Näringsliv

”Vi vill att du som kund ska vara nöjd!”

Onepair är det Uppsala-baserade företaget som säljer strumpor på nätet. Vi på Zitiz-Uppsala ringde upp en av grundarna, Niklas Thor, för att höra hur...

Näringsliv

NVS förvärvar VVS-Montage i Dalarna AB

NVS Installation AB har förvärvat VVS-Montage i Dalarna AB som ett led i satsningen att stärka sin ställning ytterligare i Dalarna. VVS-Montage är...

Näringsliv

Article image

Borlänge kommun föreslås bli Founder i Beyond Skiing 2015

Borlänge kommun kan bli en del av teamet för skid-VM 2015 i Falun. Med ett aktivt engagemang kan Borlänge kommun vara med och skapa dynamik och...

Näringsliv

Article image

Grönklittsgruppen AB förvärvar Grännastrandens Camping AB i Gränna

-Vi i Grönklittsgruppen är stolta och glada över att få förtroendet att driva Grännastrandens Camping vidare, säger Torbjörn Wallin, VD Grönklittsgruppen AB.

Näringsliv

Article image

Workshop: Hållbar affärsutveckling - en drivkraft för lönsamma affärer

Välkommen att anmäla Dig till vår intressanta Workshop om Hållbar utveckling den:

Datum: 13 mars 2012
Tid: 13:30-16:00
Plats: ÅF:s kontor,...

Näringsliv

Article image

Finansierings-möjligheter för miljöteknikföretag

Föreläsning med miljö i fokus.

Näringsliv

Article image

Leksands IF Ishockey får ny klubbdirektör från den 1 juli 2012

Leksands IF Ishockey AB har beslutat att förstärka organisationen för att på bästa sätt möta de utmaningar som kommer att ställas på föreningen i...

Näringsliv

Spiltan Fonder utses till Årets Fondbolag och Årets Sverigefond

Article image
Förvaltaren av marknadens enda aktiefond med inriktning på Dalarna, Spiltan Aktiefond Dalarna, har av nordens största privatekonomiska magasin, Privata Affärer, blivit utsedda Spiltan Fonder till Årets Fondbolag även fått utnämningen Årets Sverigefond för fonden Spiltan Aktiefond Stabil.

Näringsliv

Article image

Småföretagaren ingen skattefuskare

De senaste dagarna har Skatteverkets GD Ingemar Hansson i tidningarna målat upp bilden av den typiske småföretagaren som en skattetrixare. Han verkar...

Näringsliv

Article image

Ungdomar oavsett partitillhörighet: Vi missgynnas av turordningsreglerna

Nio av tio ungdomar anser att unga missgynnas av reglerna om att den som är sist anställd ska sägas upp först. Det visar en ny undersökning som...

Näringsliv

Article image

Rekordår för Kullaflyg

För första gången sedan starten för snart 9 år sedan har mer är 200.000 kunder flugit med Kullaflyg under ett och samma år vilket innebar en ökning...

Näringsliv

Article image

Nyårsdagen - Sveriges pizzadag. I Borlänge är Kebabpizzan populärast

Trots fler nyttighetstrender än någonsin står Sveriges största pizzadag, nyårsdagen, fortfarande ohotad. Dagen efter nyårsafton äter svensken...

Näringsliv

Article image

Skatteparadiset Sverige

Öppna ett Investeringssparkonto och avnjut ett nytt skattesystem för privatpersoners investeringar! Nästa år blir skatten ca 0,5% av kapitalet...

Näringsliv

Article image

Satsning på vinterweekends med Gotland i fokus

Med start i februari nästa år börjar Gotlandsflyg trafikera sträckan Visby-Mora. Målsättningen är att locka Gotlänningar till Dalarna på...

Om författaren

Författare:
Bengt-Arne Vedin

Om artikeln

Publicerad: 13 okt '08 10:42

Fakta

Ian Ayres: Super Crunchers. How anything can be predicted. John Murray, London 2007 (paperback 2008) föreslå

Nyckelord

Inga nyckelord | föreslå

Plats

Artikeln är inte placerad. föreslå

Dela artikeln

Länk till artikeln:

Dela på andra sätt...