Onlangs publiceerden we een diepgaand artikel over een cruciale trend in 2024: de keuze tussen open en gesloten AI-modellen. Dit onderwerp wekte grote belangstelling onder Nederlandse bedrijven, die gretig zijn om te leren hoe ze kunnen profiteren van deze ontwikkelingen in kunstmatige intelligentie. In dit vervolgartikel duiken we dieper in de wereld van open versus gesloten AI-modellen, specifiek gericht op Language Learning Models (LLM's) en hun impact op de Nederlandse markt.
We verkennen de kernverschillen tussen open en gesloten modellen en hoe deze passen binnen het bredere spectrum van AI-toepassingen in Nederland. Daarnaast beantwoorden we een cruciale vraag voor Nederlandse bedrijven: hoe kun je effectief open en gesloten AI-modellen inzetten? Is het voor elk type bedrijf rendabel om een eigen model te ontwikkelen?
Tot slot kijken we naar de toekomstige toepassingen van AI in Nederlandse bedrijven en in de LLM-sector. Waar liggen de grootste kansen voor innovatie en vooruitgang in AI? Dit artikel biedt essentiële inzichten voor bedrijven die voorop willen lopen in de AI-revolutie in Nederland.
Verschillen tussen open en gesloten modellen
Wat is nu precies het verschil tussen een open en een gesloten model? Eenvoudig gezegd zijn de gewichten die de output van het model bepalen in een gesloten omgeving niet openbaar beschikbaar. Wat betekent dit in alledaagse taal? Dit betekent simpelweg dat de gegevens waarop het model is getraind (waar het zijn kennis vandaan haalt) niet bekend zijn bij iemand buiten de personen of het bedrijf dat verantwoordelijk is voor het trainen ervan. Daarnaast is ook de manier waarop de AI-tools die kennis toepassen, oftewel hoe het die kennis inzet, verborgen. Gesloten modellen zouden ook niet beschikbaar moeten zijn om te downloaden van openbaar toegankelijke databronnen.
In tegenstelling tot gesloten modellen, is een open model vrij beschikbaar om online te downloaden. Iedereen kan het model downloaden en gebruiken. Bovendien, als de documentatie beschikbaar is, zou de persoon die het model heeft geüpload moeten vermelden op welke dataset het is getraind. Ook de gewichten achter het model, oftewel de manier waarop de LLM vragen probeert te beantwoorden, zijn openbaar beschikbaar.
Hoe we deze modellen gebruiken verschilt fundamenteel, maar dit geldt alleen voor de bouwers en degenen die het model ontwikkelen. Voor eindgebruikers is het over het algemeen zeer vergelijkbaar. Laten we het perspectief nemen van degenen die het model bouwen. Neem bijvoorbeeld bedrijf X dat hun eigen LLM wil hebben. Nu staan ze voor een cruciale beslissing: gaan we onze LLM trainen op onze eigen data of niet? En zo ja, moeten we dit dan openbaar maken? De kans is groot dat ze het gereedschap niet openbaar willen maken, gezien het feit dat de data waarop het is getraind hun wellicht een voorsprong geeft. Aan de andere kant, als we kijken naar een groep studenten die een LLM willen trainen om beter te presteren in een bepaalde taak, dan is de kans groot dat ze zowel het model als de trainingsdata beschikbaar willen stellen.
Kortom, het draait allemaal om geheimhouding. Bij gesloten modellen zijn zowel de gewichten als de trainingsdata geheim, en sommige personen of bedrijven geven hier de voorkeur aan.
Wat betreft de plek van elk van deze twee in het LLM-ecosysteem, geloven we dat zowel op het gesloten als op het open einde van het spectrum LLM's zullen blijven vooruitgaan. Grote LLM's zoals ChatGPT zijn gesloten, maar zij zijn deels verantwoordelijk voor het verleggen van de grenzen van wat mogelijk is met LLM's. Door hun vooruitgang kunnen open modellen profiteren van nieuwe technieken en inzichten, wat leidt tot een gezondere en meer diverse LLM-gemeenschap.
Deze dynamiek tussen open en gesloten modellen is cruciaal voor de toekomst van LLM's. Aan de ene kant bieden gesloten modellen mogelijkheden voor bedrijven om unieke en specifieke oplossingen te ontwikkelen die een concurrentievoordeel kunnen opleveren. Aan de andere kant zorgen open modellen voor een gemeenschappelijke basis waarop innovaties kunnen worden gebouwd, wat bijdraagt aan de algehele vooruitgang in de sector. Dit samenspel tussen exclusiviteit en samenwerking is wat de LLM-technologie zo opwindend en veelbelovend maakt voor zowel bedrijven als ontwikkelaars.
De rol van open en gesloten modellen in het zakelijk domein
De vraag die veel bedrijven zich stellen is of ze een eigen Language Learning Model (LLM) moeten implementeren en zo ja, moet dit een open of gesloten model zijn? Het is een feit dat AI tegenwoordig essentieel is voor bedrijven. Stel je twee identieke bedrijven voor, waarvan één AI gebruikt en de ander niet. Het bedrijf dat AI inzet, zal uiteindelijk een hogere productiviteit en efficiëntie ervaren. Dit maakt het voor elk bedrijf noodzakelijk om AI in te zetten.
Echter, de AI-strategie kan per bedrijf verschillen, wat we aan de hand van enkele voorbeelden zullen verduidelijken. Neem bijvoorbeeld 'Monumentus', een organisatie die monumenten beheert. Een van hun medewerkers, Anna, is een expert op het gebied van een specifiek monument, 'Kasteel de Parel'. Anna's kennis is onmisbaar, maar wat gebeurt er als ze met pensioen gaat? Een groot deel van haar kennis zou verloren kunnen gaan. Hier kan AI een oplossing bieden door zoveel mogelijk informatie die Anna achterlaat te verwerken en leren. Een open model zou in dit geval gedownload kunnen worden en blootgesteld aan Anna's data, waardoor het tijdelijk de kennisexpert over 'Kasteel de Parel' wordt. Deze kennis kan zowel intern als extern worden ingezet, maar de specifieke data en gewichten van het model blijven eigendom van Monumentus.
Een ander voorbeeld is een bedrijf dat zijn e-mailverkeer wil automatiseren door e-mails op basis van inhoud te sorteren. Hiervoor is niet per se een eigen taalmodel nodig. Een gesloten model zoals ChatGPT kan efficiënt worden ingezet om de essentie van e-mails te begrijpen en ze naar de juiste map door te sturen. Hierbij is het essentieel dat de omgeving zo wordt ingericht dat vertrouwelijke informatie beschermd blijft.
Het laatste voorbeeld betreft 'Stichting Mooi Flevoland' (SMF), die hun kennisbank dynamischer wil maken. Zij willen dat bezoekers van hun website in normale taal vragen kunnen stellen over Flevoland of de stichting. In dit geval zou een open model getraind kunnen worden op de data van SMF, waarna een chatbot op de website geplaatst wordt. SMF heeft de ambitie om een platform te creëren waar mensen hun kennis over Flevoland kunnen delen, vergelijkbaar met Wikipedia. In dit scenario zou het open model, inclusief de getrainde gewichten, publiekelijk beschikbaar gemaakt kunnen worden, zodat anderen er kennis aan kunnen toevoegen of het model kunnen verbeteren.
Samenvattend, de keuze voor een open of gesloten LLM hangt af van het specifieke probleem, de gewenste oplossing en de behoeften van het bedrijf of de organisatie. Er is geen eenduidig antwoord op de vraag of een bedrijf een eigen LLM moet draaien, en zo ja, of dit open of gesloten moet zijn. Het is een beslissing die zorgvuldig moet worden afgewogen op basis van de unieke omstandigheden en doelstellingen van elk bedrijf.
Waar liggen de kansen voor innovatie en vooruitgang?
In de dynamische wereld van Language Learning Models (LLM's) staan we aan de vooravond van significante veranderingen en verbeteringen, zowel in open als gesloten modellen. Deze ontwikkelingen zullen een grote invloed hebben op hoe bedrijven AI inzetten en integreren in hun operaties en dienstverlening.
Open modellen evolueren in een razendsnel tempo. Ze worden steeds geavanceerder, gebruiksvriendelijker en breder toepasbaar. Hierdoor wordt het voor bedrijven eenvoudiger en betaalbaarder om een eigen model te trainen en te implementeren. De benodigde expertise wordt ook steeds toegankelijker. We zullen dan ook een toenemende trend zien waarin meer organisaties hun eigen Large Language Models lokaal gaan draaien.
Aan de andere kant winnen gesloten modellen aan waarde in een AI-gedreven wereld. Het bedrijf met de meest geavanceerde AI heeft een aanzienlijke voorsprong. Bedrijven die hun data effectiever kunnen gebruiken, deze dynamischer maken en breder toegankelijk voor hun medewerkers, zullen sneller en efficiënter opereren. Hierin ligt een enorme kans voor bedrijven om hun concurrentiepositie te versterken.
Om de kansen voor AI bij Nederlandse bedrijven maximaal te benutten, zijn vier stappen noodzakelijk. Ten eerste dienen bedrijven op de hoogte te zijn van de ontwikkelingen op het gebied van AI. Dit is een essentieel onderdeel van educatie, aangezien je je niet kunt voorbereiden op iets wat je niet kent.
Zodra AI als concept redelijk helder is, is de tweede stap het scherp krijgen hoe het bedrijf AI gaat opnemen in haar processen, producten en diensten. Dit is de verkenningsfase. Het is een kwestie van brainstormen met experts, processen en diensten analyseren vanuit het perspectief van AI en overleggen over wat mogelijk is.
Uit deze sessies komt een duidelijk beeld van waar de kansen liggen op zowel korte als lange termijn. De volgende stap is prioritering: concreet bepalen wat het laaghangend fruit is. Wat zijn de toepassingen van AI die snel effect hebben en waardoor we A. meer kennis van het werken met AI opdoen en B. de concurrentie voor kunnen zijn.
De laatste stap is uitvoeren. Nu is het duidelijk welke processen of producten winst kunnen boeken met AI. Het is nu een kwestie van implementeren, monitoren en waar nodig verbeteren.
Deze vier stappen zijn iteratief: AI als technologie ontwikkelt zich, het bedrijf groeit, processen evolueren en producten worden gelanceerd. Ook zal de kennis en kunde omtrent AI binnen de organisatie toenemen. Bij Bytesize AI ondersteunen we organisaties bij dit proces. Dit is wat wij beter doen dan wie dan ook. Wij hebben deze stappen met onze klanten al meerdere keren doorlopen, en het is een proces dat wij ook intern implementeren.