Sport Data Valley: delen is vermenigvuldigen

Sport Data Valley biedt individuen, bedrijven en organisaties een platform om kennis te delen. Van elkaar leren, dat is de basis achter Sport Data Valley. "Anderen gaan er niet met jouw idee vandoor, maar maken jouw goede idee nog beter", zegt Joost Kok. Als initiatiefnemer en directeur van het Leiden Centre of Data Science en het Sport Data Center speelt Kok een belangrijke rol bij de Sport Data Valley van Sportinnovator.

Redactie 11 januari 2018, 10:00

Naast directeur van het Sport Data Center is Kok hoogleraar Informatica en ook hoogleraar Geneeskunde. Als wetenschapper weet hij hoe big data een vlucht kunnen nemen als het wordt gedeeld. In de wetenschap is het de afgelopen jaren gemeengoed geworden om data te delen. Kok: “Wetenschappers schrijven tegenwoordig niet meer maandenlang eenzaam op een zolderkamertje aan een artikel. Dat is een proces geworden waarbij ze hun ideeën op elkaar loslaten, om op die manier tot diepere inzichten te komen.” Die werkwijze wil Kok met de Sport Data Valley ook in de sport introduceren.

Kennis en data uitwisselen

Kok noemt als voorbeeld het platform OpenML, waar datasets en nieuwe methodes gedeeld kunnen worden. In de wetenschap ziet hij dat daar steeds meer kennis en data wordt uitgewisseld door wetenschappers. "Wetenschappers realiseren zich tegenwoordig dat zij dankzij het delen van data en kennis op een platform als OpenML sneller verder komen. Anderen gaan er niet met jouw idee vandoor, maar maken jouw goede idee nog beter. Daar profiteert uiteindelijk iedereen van.”

"Het gaat er vooral om individuen, bedrijven en andere organisaties die zich op wat voor manier dan ook met sportdata bezighouden, met elkaar te verbinden." - Joost Kok.

Geen database

Sport Data Valley beoogt eenzelfde digitale structuur op te zetten voor de sportwereld. “Het is geen database”, benadrukt hij. “Dat misverstand wil ik meteen uit de wereld helpen. We vragen bedrijven niet om al hun data via het platform te delen. Het gaat er vooral om individuen, bedrijven en andere organisaties die zich op wat voor manier dan ook met sportdata bezighouden, met elkaar te verbinden.”

Metadata

In de sportwereld bestaat veel koudwatervrees tegen het delen van kennis. In de topsport willen mensen de concurrentie niet wijzer maken. Kok onderkent de verschillen tussen de sportwereld en de wetenschap. Dat vereist in enkele opzichten een andere aanpak. “Natuurlijk willen topsportorganisaties hun geheimen niet prijsgeven, maar je kunt wel laten zien over welke data je beschikt zonder dat je die data zelf ook meteen vrijgeeft. Met metadata kun je vaak al matchen. Als partijen van elkaar weten wat ze weten, kunnen ze veel beter inschatten of en wat ze voor elkaar kunnen betekenen. Het kan bijvoorbeeld zijn dat iemand een bepaalde analysesystematiek heeft bedacht voor voetbal, die ook heel geschikt kan zijn voor hockey. Dat hoeft elkaar niet te bijten, in tegendeel. Door die systematiek te delen en er met meer mensen over na te denken, wordt het waarschijnlijk alleen maar beter.”

'Verschillende smaken'

Hoewel het vrijgeven van datasets dus geenszins verplicht is, behoort het wel degelijk tot de mogelijkheden. “Natuurlijk willen we ook graag open datasets”, zegt Kok. “De meerwaarde van Sport Data Valley is dat je daar alle verschillende smaken hebt. Je kunt alleen metadata delen, je kunt ook een deel van de dataset vrijgeven, of de hele set maar slechts een beperkt deel van de gegevens over die hele set. In de wetenschap hebben we die stap al lang gemaakt.”

"De meerwaarde van Sport Data Valley is dat je daar alle verschillende smaken hebt. Je kunt alleen metadata delen maar je kunt ook een deel van de dataset vrijgeven." - Joost Kok.

Wereldspeler

Een van de grootste uitdagingen bij het inrichten van de Sport Data Valley, is het standaardiseren van data. Kok: “Als je met verschillende datasets dezelfde funnel analyses wil doen, moeten die sets voldoen aan dezelfde standaarden, bijvoorbeeld als het gaat om opslag. Dan gaat het om vragen als: Hoe label je data? Op dat gebied zetten we in Nederland op dit moment de standaard. Niet alleen op het gebied van dataopslag is Nederland een van de koplopers. Ook als het gaat om slimme algoritmes zijn we een wereldspeler in de wetenschap.”

Die wereldspeler wil Kok ook van Nederland maken als het om sportdata gaat. “Daarvoor hebben we data en metadata nodig van iedereen die in Nederland iets doet met sport en bewegen. Om het vliegwieleffect van big data te realiseren, heb je een bepaalde kritische massa nodig. Dan gaat het niet alleen om de hoeveelheid opgeslagen data, maar ook om de mensen die zich binnen dat netwerk met die data bezighouden. Hoe meer hoe beter, want delen is in dit geval vermenigvuldigen."

Gerelateerd nieuws