Big data van honderden miljoenen Chinese consumenten


De hoeveelheid klantgegevens die bedrijven verzamelen is in de afgelopen jaren flink toegenomen. Veel online gegevens zoals het surf- en klikgedrag van consumenten kunnen inmiddels gekoppeld worden aan gegevens uit andere bronnen zoals het koopgedrag in winkels. Omdat het om enorme hoeveelheden data met een grote diversiteit gaat die continu verandert is gigantische rekencapaciteit van megacomputers nodig om alles te kunnen verwerken, analyseren en gebruiken. We spreken in dat geval van big data.

Als we kijken naar China zijn de ontwikkelingen op het gebied van big data erg interessant. Met 780 miljoen online Chinezen in het eerste kwartaal van 2016 is er geen land waar internetbedrijven meer data over gebruikers van online platforms kunnen verzamelen dan China. En de eerste interessante toepassingen zijn al in ontwikkeling.

Heatmaps en menigten

In 2014 liet Baidu, China’s belangrijkste internetzoekmachine, zien wat er mogelijk was met de data die ze verzamelde. Elk jaar vindt in China net voor Chinees Nieuwjaar een ware volksverhuizing plaats wanneer arbeiders van de fabrieken in het oosten voor een of twee weken terugkeren naar hun families op het platteland. Op basis van locatiegegevens van smartphones waarop Baidu Maps (vergelijkbaar met Google Maps en met 500 miljoen Chinese gebruikers) gebruikt werd, kan Baidu afleiden waar mensen hun reis beginnen, welke route ze nemen en waar ze eindigen. Zo wist Baidu te achterhalen dat het grootste deel van de migranten vertrekt uit Beijing, Shanghai en Guangzhou en reist naar Beijing, Chongqing en de provincies Hunan en Guangxi. Klik hier om voormalig Baidu-medewerker Kaiser Kuo de heatmap te zien toelichten. De real-time heatmap is hier te bekijken.

Baidu heatmap.

Nu is zo’n heatmap erg leuk om naar te kijken, maar wat kun je er nu praktisch mee? Nou, je zou de gegevens kunnen gebruiken voor de planning van transportcapaciteit. Maar location-based datamining zou ook levens kunnen redden. Op 31 december 2014 vonden 36 mensen de dood tijdens een stampede in Shanghai doordat 300.000 mensen zich voor de nieuwjaarsviering op een plek hadden verzameld die deze capaciteit niet aankon. Baidu heeft sindsdien op basis van zoekgedrag van gebruikers van Baidu Map een algoritme ontwikkeld dat de vorming van menigten kan voorspellen en dergelijke tragedies zou kunnen voorkomen. Op basis van raadplegingen over routes naar een bepaalde locatie kan Baidu met de geaggregeerde data 1-3 uur vooraf een waarschuwing geven dat het ergens extreem druk zal worden. Ook kan in geval van gevaar een waarschuwing aan de lokale autoriteiten gestuurd worden. Baidu verwacht dit onderzoek op termijn te vermarkten als een dienst binnen Baidu Maps.

Epidemieën en spooksteden onder de loep

Twee jaar geleden lanceerde Baidu een interactieve kaart waarop de verspreiding van ziekten gevolgd kan worden. Baidu combineert locatiedata met zoekopdrachten naar griep, hepatitus, TBC en SOAs en voorspelt op basis van data van de afgelopen 30 dagen het ziekteverloop in de komende week en daarmee lokale epidemieën. Deze data kan gebruikt worden voor een efficientere distributie van geneesmiddelen en betere inzet van de capaciteit van de gezondheidszorg.

De afgelopen jaren is er veel geschreven over Chinese spooksteden. Journalisten vallen over elkaar heen met verhalen over hoe China dusdanig veel steden heeft gebouwd dat een deel geen bewoners kan vinden en leeg staat. Baidu bewees vorig jaar met behulp van een big data analyse dat sommige spooksteden alles behalve uitgestorven zijn. Door zes maanden lang locatiedata van de telefoons van 770 miljoen Baidu-gebruikers te analyseren kon men berekenen hoeveel mensen er op een moment aanwezig waren in  een stad.

Op basis van de berekende bevolkingsdichtheid identificeerde men 50 spooksteden (steden met minder dan 5.000 mensen per vierkante kilometer; de helft van de overheidsdoelstelling voor urbanisatie). Sommige steden hadden tijdens nationale feestdagen echter veel meer inwoners dan in de rest van het jaar. Dit bleken vakantiebestemmingen te zijn waar veel Chinezen een tweede huis hebben of tijdelijk huren. Andere steden, zoals het toch al akelig uitgestorven Kangbashi (Ordos, Binnen-Mongolië), liepen juist leeg tijdens de nationale feestdagen. Wat nu de echte spooksteden waren maakte Baidu niet bekend; het zou een enorme invloed hebben op de verkoop van onroerend goed. De data kan door de overheid echter wel gebruikt worden om hun stedenplanning te verbeteren.

Het einde van files?

In steden als Beijing kan het een uitdaging zijn om van A naar B te komen door het grote aantal auto’s op de weg en de vrijwel altijd aanwezige files. Didi Chuxing, China’s marktleider op het gebied van taxi-/ vervoer-apps, wil de files te lijf gaan met een programma genaamd ‘Tides’. Hoe meer vervoersmiddelen –  denk aan privévoertuigen, taxi’s en carpoolers –  zijn aangesloten bij Didi des te beter zou Didi het verkeer kunnen regelen en optimaliseren op basis van big data. Didi denkt reizigers te kunnen matchen met iemand in de buurt die dezelfde bestemming heeft door hen te laten carpoolen in een eigen vervoersmiddel of taxi. Ook wil ze bij filevorming aangesloten vervoersmiddelen een rustigere route laten rijden in plaats van dezelfde route als alle anderen op de weg. Met behulp van big data denkt Didi zelfs files te kunnen voorspellen voor ze optreden en het verkeer daarop aan te passen. Combineer dit met het initiatief van Baidu om net als Google een zelfrijdende auto te introduceren, waar ook een grote hoeveelheid data van kaarten, camera’s en navigatiesystemen nodig zal zijn en files in Beijing zouden daarmee over enkele jaren wel eens tot het verleden kunnen behoren.

Kredietwaardigheid

Begin 2015 gaf China’s Centrale Bank acht bedrijven toestemming voor het ontwikkelen van kredietwaardigheidsmodellen. Tencent en Alibaba zijn met de door hen ontwikkelde modellen in een gat in de markt gesprongen dat door de nationale banken slecht werd gevuld: het verstrekken van leningen aan consumenten. China’s centrale bank heeft ook een kredietwaardigheidsmodel, maar dekt daarmee schijnbaar slechts 300 miljoen consumenten en mist daarbij vooral studenten, consumenten met lage inkomens en mensen die nooit eerder een lening hebben afgesloten. Die laatste groep betreft volgens een onderzoek van de Southwestern University of Finance & Economics in Chengdu 84% van alle Chinese huishoudens. Alibaba heeft 400 miljoen gebruikers op Alipay met een veel diverser profiel en Tencent kan dankzij haar diverse online producten als sociale netwerken (QQ en WeChat) en gaming platforms ruim 800 miljoen consumenten ‘scoren’.

Ook de derde partij van de Chinese ‘BAT’ (Baidu, Alibaba & Tencent) onderneemt stappen in de inzet van big data in de wereld van Consumer Finance. Samen met Citic Bank richtte Baidu de online bank Baixin op. Baidu heeft als leidende zoekmachine in China veel data over het zoek- en klikgedrag van haar gebruikers en kan daarmee voor financiële producten de juiste doelgroep bepalen. Baidu zet haar big data dus vooral in voor doelgroepsegmentatie.

Ook Wanda Group, een Chinees conglomeraat met enorme winkelcentra, een online shop en het 99Bill online betaalplatform verzamelt dusdanig veel data dat het een kredietbeoordelingsysteem wil opzetten. Waar de BAT zich richten op online data hoopt Wanda in 2020 van 500 miljoen consumenten offline data te kunnen verzamelen op basis van hun winkelgedrag bij 2 miljoen verkopers in 4.000 winkelcentra, zowel die van Wanda als die van derden. Hiermee wil Wanda diverse financiële diensten ontwikkelen waaronder kredietwaardigheidscoring en leningen.

In hun kredietwaardigheidsvoorspellingen gaan deze bedrijven overigens erg ver in de data van consumenten die ze gebruiken. Maar daarover over twee weken meer…

Dit is het eerste artikel uit een serie van drie over het gebruik van big data in China.