Väitös, tietotekniikka, MSc Nicola Dainese

Tapahtumat

Väitös, tietotekniikka, MSc Nicola Dainese

��ä��ö��پ��ܻܳ��

Kielimallit otostehokkaiden, hyvin yleistyvien ja tulkittavien RL-agenttien kehittämiseen maailmamallien ja black box -optimoinnin avulla.

Väitös Aalto-yliopiston perustieteiden korkeakoulusta, tietotekniikan laitokselta.

Shakkilauta ja sen varjo. Tekijänoikeus: Carlo Dainese.

Milloin

29.4.2026 12:00 – 15:00 (UTC +3)

�Ѿ��ä

Tietotekniikan talo

Tapahtuman kieli

Englanti

Väitöskirjan nimi: World modeling and black-box optimization with language models

��ä��ٳٱ��ä: Nicola Dainese
�ղ��ٲ��ä��ٳ�ä��ä: apulaisprofessori Florian T. Pokorny, KTH Royal Institute of Technology, Ruotsi
Kustos: apulaisprofessori Pekka Marttinen, Aalto-yliopiston perustieteiden korkeakoulu

Maailmanmallinnus ja mustan laatikon optimointi kielimalleilla

Viimeaikaiset vahvistusoppimisen (reinforcement learning, RL) edistysaskeleet ovat tuottaneet suorituskykyisiä agentteja, mutta nykyiset menetelmät ovat edelleen dataepätehokkaita ja yleistävät heikosti, oppien alusta alkaen ilman ennakkotietoa. Tämän väitöskirjan tavoitteena onkin tutkia, kuinka kielen avulla voidaan parantaa RL-agenttien otostehokkuutta ja yleistämiskykyä sisällyttämällä ennakkotietoa niiden maailmamalleihin. Lisäksi työ tarkastelee suurten kielimallien (large language model, LLM) käyttöä black box -optimoinnissa (BBO) sovelluksina kehotteiden optimointi ja symbolinen regressio. Nämä tutkimussuunnat yhdistyvät ohjelmallisissa maailmamalleissa, joissa ohjelmasynteesiä sovelletaan maailmamallinnukseen, tuottaen agentteja, jotka mukautuvat nopeasti kielellä kuvattuihin tehtäviin ja hyödyntävät tulkittavia sisäisiä malleja.

Väitöskirjan kontribuutioihin kuuluu stokastinen maailmamalli, joka hyödyntää kielellisiä kuvauksia ja parantaa suorituskykyä suhteessa nykyisiin huippumenetelmiin; LLM-pohjaiset BBO-menetelmät, jotka paljastavat avoimen lähdekoodin kielimallien odottamattoman robustiuden docstring-muutoksille sekä saavuttavat huipputason tuloksia symbolisessa regressiossa yksinkertaisemmilla kaavoilla; sekä kaksi ohjelmallisiin maailmamalleihin perustuvaa lähestymistapaa (toisessa hyödynnetään LLM-pohjaista koodin generointia Monte Carlo -puuhaun ohjaamana nopeamman ja tulkittavan suunnittelun saavuttamiseksi, ja toisessa esitellään visuaalisen suunnittelun vertailuympäristö, joka tuo esiin symbolisen ja suoran VLM-pohjaisen suunnittelun komplementaariset vahvuudet). Yhdessä nämä tulokset edistävät autonomisten agenttien kehitystä, jotka kykenevät järkeilemään, suunnittelemaan ja optimoimaan kielen avulla, yhdistäen mallipohjaisten menetelmien tehokkuuden ja tulkittavuuden LLM:ien joustavuuteen.

Avainsanat: vahvistusoppiminen, maailmanmallit, isot kielimallit, kuva-kielimallit, mustan laatikon optimointi

Linkki väitöskirjan sähköiseen esittelykappaleeseen (esillä 7 päivää ennen väitöstä): .

Yhteystiedot: nicola.dainese@aalto.fi

Perustieteiden korkeakoulun väitöskirjat ovat saatavilla yliopiston ylläpitämässä avoimessa Aaltodoc-julkaisuarkistossa.

2020_Computer_Science_building_photo_Matti_Ahlgren_Aalto_University-8

Tietotekniikka yhdistää kaikkia aloja. Aalto-yliopistossa tietotekniikan tutkimus yhdistyy tieteen käytännönläheisiin sovelluksiin.

Pikaoppaaseen

��ä��ٱ�ٳٲ�: 14.4.2026
Julkaistu: 4.3.2026

�鶹��ý