Data Driven Double IPA - Data Science Lab

BIER BROUWEN MET AI

Een data gedreven biertje brouwen? Dit zal waarschijnlijk een legio van vragen oproepen. Wordt het bier gebrouwen door computers? Is dat wel te drinken? Bierbrouwen is toch een vakmanschap, een ambacht, moeten we dat niet aan brouwers overlaten?

Geen stress, pak een lekker drankje, in deze blog wordt ingaan op het bier dat wordt gecreëerd in samenwerking tussen Uiltje Brewing Company en Data Science Lab. Wij geven jou inzicht in het proces en het mystieke rondom het woord ‘datagedreven’.

Als jong innovatief bedrijf vonden wij in Uiltje direct een gelijkgestemde partner. Een bier brouwen op basis van data, hoe vet is dat! Een project wat goed past binnen ons Lab. Maar hoe komt een dergelijk idee tot stand? Het zal niemand verbazen dat een vrijdagmiddag hiervoor het startschot heeft gegeven. Kunnen wij niet iets doen met data en bier? Het vervolg hierop is duidelijk… Wie niet waagt, wie niet wint.

Leuk idee, maar hoe gaan wij dit doen. Bij een dataproject, ongeacht of dit een dashboard of Deep Learning model moet gaan opleveren, bestaat de fundering uit data. Op zich niks schokkends, maar welke data moet dit zijn? Hoe komen wij aan deze data? En misschien nog wel belangrijker, wat willen wij er exact mee doen? Allereerst komen de vragen naar boven, hoe komt een bier gewoonlijk tot stand?

Om een goed antwoord te krijgen op deze vraag spraken wij met Marko Mihalić, Brewery Manager bij Uiltje:

“Uiltje heeft natuurlijk de Fresh & Fast lijn. Elke 2 weken een nieuw bier geleverd. Dit betekent dat we elke 2 weken een nieuw bier maken. Hierbij variëren wij van stijl, de ene week een DIPA en 2 weken later bijvoorbeeld een Session IPA. Hierdoor creëren wij variatie in wat wij uitbrengen. Inspiratie hiervoor halen wij o.a. uit de beschikbare hop soorten en de kwaliteit van deze hoppen. Hop is net als een druif bij wijn, eenzelfde hop geeft elk jaar een iets andere smaak. Daarnaast testen wij in ons eigen lab veel met verschillende hop combinaties om tot nieuwe smaken te komen. Verder komen er altijd nieuwe hop soorten uit de VS waarmee we aan de slag kunnen. In ons lab brouwen we dan experimentele brouwsels van 20 – 25L en testen we dingen uit waarmee we uiteindelijk op recepten voor nieuwe bieren komen”

Duidelijk, bierbrouwen is een vakmanschap. Zoals in vrijwel alle sectoren kan data een hele mooie ondersteunende factor zijn. Het kan verbanden weergeven waar men zelf niet zo snel op zou komen. Vervolgens is het aan de gebruiker om iets met de resultaten te doen. Computers kunnen nou eenmaal geen interpretatie geven aan data. Met dit in het achterhoofd beginnen wij ook aan dit project. De bierbrouwers moeten uiteindelijk met het resultaat gaan werken. Zij zijn dan ook een logisch startpunt. Met welke input vanuit data kunnen jullie aan de slag? Hoe zouden jullie met onze hulp een data gedreven bier kunnen brouwen? En hoe kijken jullie als brouwerij aan tegen het gebruik van data?

Deze, en nog vele andere vragen, hebben wij gesteld aan de brouwers van Uiltje. Hieruit kwam het volgende:

Marko: “Een smaakpalet zou een perfect beginpunt zijn voor ons om een recept en brouwsel te gaan ontwikkelen. Als er vanuit de data en het algoritme een set van karakteristieken bij een specifieke bierstijl kan worden aangeleverd dan kunnen wij daar mee verder. Het gebruik van data om op deze manier een recept te ontwikkelen is nieuw voor ons. Op het gebied van marketing en sales gebeurt steeds meer met data, dit is te vergelijken met andere commerciële bedrijven. Echter in het ontwikkelen van een nieuw recept en brouwsel is dit nog niet het geval. Onze ‘brew kit’ is redelijk handmatig. We hebben wel computers welke de koeling van het brouwsel reguleren en ook de pompen worden door computers aangestuurd. We hebben de ambitie om hier nog wat meer in te gaan automatiseren, bijvoorbeeld bij het maischen. Deze ambitie past binnen het kader van een Craft brouwerij. Craft gaat voornamelijk om het werken met een levend product, het brouwsel, zonder vreemde extracten, zonder gebruik van hopextracten en zonder te pasteuriseren”

Goed. Wij als data scientists weten wat ons te doen staat, data verzamelen! Dit is voor ons vertrouwd terrein. We hebben data uit reviews nodig, echte meningen van consumenten over bier. Desondanks dat wij op kantoor een eigen bar hebben, is onze eigen data op dit punt nog redelijk beperkt. Dit mag geen probleem zijn, het ontbreken van geschikte data komt vaker voor. Gelukkig leven wij in de 21^e eeuw en zijn externe databronnen vrijwel altijd voorhanden, zo ook in dit geval. Online reviews worden over vele zaken gegeven, zo ook over bier. Er zijn hier zelfs verschillende websites, apps, forums, etc. voor in het leven geroepen. Perfect!

Webscraping. Een techniek welke informatie van webpagina’s verzameld en waardoor een dataset opgebouwd kan worden. Op deze manier kan gemakkelijk een externe dataset worden verzameld van openbaar aangeboden data. Hoe dit er technisch uit ziet lees je in deze blog waarin wij ook ingaan op verschillende haken en ogen. Voor deze blog houden wij het luchtig. We hebben data, en nu?

Nu hebben wij de reviews, vele meningen over vele verschillende bierstijlen. Hoe lekker vonden ze het bier? Welke smaken proefde ze? Om welke bierstijl gaat het? Hoeveel alcohol zat erin? Werd er nog iets anders noemenswaardig gezegd? Voldoende informatie waarin overzicht moet worden gecreëerd. Wij zijn opzoek naar de optimale combinatie van kenmerken van een specifieke bierstijl. Sommige informatie is vrijwel kant en klaar beschikbaar, zoals alcoholpercentages, bierstijlen, etc. Echter, wat men er exact lekker aan vond is niet direct voor handen. Welke smaak combinaties kan men bekoren? Om hier wat meer inzicht in te krijgen hebben wij gebruik gemaakt van Natural Language Processing, ofwel NLP.

NLP-methoden worden gebruikt om waardevolle informatie uit stukken tekst te halen. Op deze manier kunnen we smaken en steekwoorden koppelen aan een review. Alles goed en wel, iemand kan bijvoorbeeld wel citrus, gras & romigheid proeven in een IPA, maar hoe komen deze smaken in het bier? Welke ingrediënten zorgen voor welke smaken? Hoe speelt Uiltje dit klaar?

Marko: “De aroma’s die vrijkomen in een brouwsel kunnen door verschillende dingen worden veroorzaakt. Zo hebben hop soorten elk hun eigen specifieke smaak. Bijvoorbeeld de ‘Columbus’ hop geeft een grasachtige smaak af en zijn er gist soorten welke een ‘hazy’ smaak veroorzaken. Wij hebben verschillende bieren met fruit tonen. Smaken als ananas kunnen niet direct uit hop of gist worden gehaald, hiervoor werken wij regelmatig met fruit purees welke aan het brouwsel worden toegevoegd. Verder kan er met hop oliën & dry-hoppen nog verschillende smaken aan het brouwsel worden meegegeven. Naast hop is mout natuurlijk een ingrediënt van bier. Smaken als chocolade en koffie komen uit de mout. Bier rijpen op vaten, ‘barrel aged bier’, kan ook weer andere unieke smaken aan het bier geven vanuit het hout of de drank welke daarvoor op dat vat lag”

Zo veel mogelijkheden om smaken aan bier te geven! Niet zo gek dat ‘craft bier’ de laatste jaren een vlucht heeft genomen. Wij zien data science projecten veel voorkomen in dergelijke ‘groeiende markten’ omdat hier vaak nog meer ontwikkeling valt te realiseren. Dit belooft veel voor dit project!

What’s next? Modeleren! Op deze dataset maken we een regressiemodel om een set van optimale kenmerken te vinden. Dit zijn de kenmerken van het optimale bier. Hoe wij dit technisch hebben aangepakt lees je in de volgende blog! Bij kenmerken denken wij dan o.a. aan het alcoholpercentage, IBU (bitterheid uit hop), geur, mondgevoel en natuurlijk de smaak combinatie. Met dit regressie model zijn wij bij een optimale set van bieren gekomen van een specifieke bierstijl. Beter gezegd, dit model geeft ons de verhoudingen weer van de best mogelijke smaak combinatie. Deze verhouding geven wij door aan Uiltje. De brouwers kunnen aan de slag, wij kunnen niet wachten.

Vragen?

Boudewijn Gresnigt

boudewijn.gresnigt@datasciencelab.nl

+316 28 47 67 67