© BlueGen
Author profile picture

About BlueGen.ai

  • Founders: Edwin Kooistra & Iman Alipour
  • Founded in: 2022
  • Employees: 8
  • Money raised: €500.000
  • Ultimate goal: Becoming the authority on synthetic data

AI-systemen zijn met een opmars bezig. Daarmee neemt de vraag naar data toe. Deze intelligente modellen moeten immers worden getraind. De gegevens zijn echter vaak privacygevoelig waardoor bedrijven datasets niet zomaar kunnen gebruiken of delen. Het techplatform BlueGen.ai heeft een algoritme dat dit probleem verhelpt. Met hun software maken ze synthetische datasets die niet te herleiden zijn naar het individu. Hierdoor hoeft men geen rekening te houden met privacyregelgeving. In deze aflevering van start-up-of-the-day vertellen oprichters Edwin Kooistra en Iman Alipour over hun AI-systeem en kunstmatige datasets.

Wat is BlueGen.ai?

Alipour: “Digitale bedrijven moeten het hebben van data. Het is hun life blood. Die gegevens zijn noodzakelijk om te kunnen innoveren. We zien dat er steeds meer datasets beschikbaar komen. Bedrijven nemen ook vaker belangrijke beslissingen op basis van data-analyses. Ze worstelen alleen wel met de privacybeperkingen. Wij maken die data toegankelijk zodat zij hun onderneming beter kunnen sturen.”

Kooistra: “Onze AI-software leert van de oorspronkelijke dataset en genereert vervolgens een nieuwe versie die lijkt op het origineel. Het bevat alle verbanden, maar geen privacygevoelige of herleidbare gegevens. Op dit moment zijn bedrijven nog heel beperkt in wat ze met hun datasets kunnen doen vanwege privacy-redenen. Er bestaan wel technologieën om de data te anonimiseren, maar die zijn niet toereikend. Ze vernielen de correlaties tussen de datapunten. Met onze kunstmatige dataset kunnen bedrijven die gegevens wel gebruiken voor het trainen van hun eigen modellen. Of om ze te delen met andere partijen.”

Hoe kunnen jullie de privacy van gegevens garanderen?

Kooistra: “We hebben een wiskundig model ontwikkeld op basis van differential privacy waarmee gegevens uit een dataset niet tot personen te herleiden zijn. Dat model is ook getoetst door het Centrum Wiskunde & Informatica. Daarnaast werken we met decentralised learning. De datasets worden niet met ons platform gedeeld. De data blijft bij de bedrijven. Onze technologie bestaat namelijk uit twee componenten. Een discriminator en een generator. De discriminator zet de data om in bruikbare statistieken en stuurt deze naar de generator die er een synthetische dataset van maakt. Zonder dus de oorspronkelijke data gezien te hebben.”

Hoe zijn jullie op het idee gekomen voor BlueGen? 

Alipour: “Ik kwam in contact met Delft Enterprise om te kijken hoe ik start-ups kon bijstaan die voortkwamen uit de TU Delft. Eigenlijk was het eerste gesprek dat ik had met professor Lydia Chen. Zij vertelde dat ze bezig was met synthetische data. Al tijdens het gesprek zelf trok dat heel erg mijn aandacht. Het product was toen al redelijk doorontwikkeld, maar ze hadden nog mensen nodig als wij die ervaring hadden met het opzetten van bedrijven. Die gesprekken hebben we gehad in juli 2022. Op 21 september is BueGen.ai geboren. We zijn nu een aantal pilots verder en we hebben tientallen bedrijven gesproken die interesse hebben.”

Hoe zijn de eerste paar maanden verlopen?

Alipour: “We zijn net begonnen en we barsten van de energie. Elke dag boeken we meer successen. We krijgen heel veel tractie van de markt om hier mee door te gaan.”

Kooistra: “Het ontwikkelt zich allemaal boven verwachting. Dan doel ik met name op hoe mensen ons weten te vinden. We worden bijvoorbeeld gevraagd voor presentaties en voor een start-up evenement als Slush. Daar benaderde EDF ons, een van de grootste energieleveranciers van Europa, omdat ze in onze techniek geïnteresseerd zijn. Het is niet normaal dat dit binnen twee maanden na de start van het bedrijf gebeurd. Het is echt een roller coaster op dit moment.”

Was het moeilijk om investeringen te krijgen?

Alipour: “We zijn nog niet op zoek geweest naar investeringen. We zijn zelf in staat om de pre-seed te bekostigen, met ondersteuning van Delft Enterprises. We spreken nu wel met een aantal investeerders, maar we hebben op dit moment geen financiering nodig. We zijn vooral benieuwd naar de gesprekken en de contacten om ons netwerk uit te bouwen en ons verder te oriënteren. We sluiten niet uit dat we over een jaar wel financiering gaan zoeken, maar dat hangt af van hoe snel we groeien.”

Wat maakt jullie product beter dan wat er al op de markt is?

Kooistra: “De technologie is ontwikkeld door de TU Delft, waarbij nieuwste ontwikkelingen op
researchgebied snel toegepast konden worden binnen het product. Hiermee blijven we vooruitlopen op de markt. Dit vertaalt zich op dit moment vooral in de nauwkeurigheid en privacy van de door ons gegeneerde synthetische data, wat cruciaal is voor het succes en adoptie ervan. Daarnaast kunnen we dankzij het decentralized learning veiliger en sneller uitrollen.”

Alipour: “Onze technologie onderscheid zich van andere partijen door ons wiskundig model, waarmee wij kunnen garanderen dat de privacy gewaarborgd blijft. We hebben namelijk ook geleerd dat niet alle synthetische data is per definitie veilig is. In sommige gevallen kan het terug geleid worden naar de brondata. Dat dekken wij af met ons model.”

Wat is het ultieme doel van BlueGen?

Kooistra: “Wij geloven heilig dat data-innovatie mogelijk gemaakt moet worden op een privacy-veilige manier. Deze twee hoeven elkaar niet te bijten. Wat ons op dit moment drijft is om echt een impact te maken op sociaal-economisch gebied.”

Alipour: “Het ultieme doel is een duurzame organisatie te bouwen en de autoriteit te worden voor synthetische data. Ik denk namelijk ook dat wij een stukje educatie moeten geven. Bedrijven moeten leren dat deze technologie bestaat en hoe ze het kunnen inzetten. Ik hoop dan ook dat we uiteindelijk gezien worden als een trusted advisor.”