Reinforcement Learning (DAT605)

Dette emnet introduserer AI og optimalisering gjennom praktisk læring! Dette emnet gjør det enkelt og morsomt å takle optimaliseringsutfordringer, og viser deg hvordan du effektiviserer komplekse modeller, bygger smarte systemer som lærer og tar avgjørelser på egenhånd, og avdekker mønstre i data for å veilede bedre resultater. Få ferdigheter som gjelder for ulike felt, fra effektiv modelldesign til problemløsning i den virkelige verden.


Dette er emnebeskrivelsen for studieåret 2025-2026. Merk at det kan komme endringer.

Fakta

Emnekode

DAT605

Versjon

1

Vekting (stp)

5

Semester undervisningsstart

Høst

Antall semestre

1

Vurderingssemester

Høst

Undervisningsspråk

Engelsk

Innhold

NB! Dette er et valgemne og kan avlyses dersom færre enn 10 studenter er påmeldt innen 20. august.

Vi bygger bro mellom veiledet og uovervåket læring. Mens overvåket læring er avhengig av merkede data og uovervåket læring søker skjulte mønstre uten etiketter, tar Reinforcement Learning (RL) en unik tilnærming. Den kombinerer læring fra eksempler med beslutningstaking i komplekse miljøer - å lære av erfaring for å ta optimale valg over tid.

I dette emnet vil du utforske det vesentlige av RL, fra funksjonstilnærming til avansert beslutningstaking. RL henter fra informatikk, psykologi og nevrovitenskap, noe som gjør det til et kraftig verktøy for et bredt spekter av applikasjoner, fra spill, spillteori og kontrollsystemer til sverm-intelligens og optimalisering.

Læringsutbytte

Dette emnet introduserer grunnleggende teori og praktiske programmeringsferdigheter i forsterkende læring (RL) på en engasjerende og tilgjengelig måte.

Kunnskap

Introduksjon til forsterkende læring: Få en solid forankring i RL og se hvordan det gjelder for beslutningstaking i den virkelige verden.

Ressurser og oppsett: Gjør deg kjent med kursmateriell og kodeverktøy. Et lynkurs om nevrale nettverk og rammeverk for dyp læring er også inkludert.

Kjernemetoder: Oppdag hvordan agenter lærer av sine valg og tilbakemeldinger for å ta smartere beslutninger.Lær av erfaring: Forstå hvordan agenter tilpasser seg og forbedrer seg basert på handlingene deres og belønningene de mottar.

Avanserte teknikker: Utforsk metoder som hjelper agenter med å ta effektive beslutninger, selv i komplekse situasjoner.

Ferdigheter

Programmeringsferdigheter

Grunnleggende om algebra, sannsynlighet og statistikk

Kjennskap til Python, Numpy og Matplotlib

Generell kompetanse

Få en grunnleggende forståelse av nevrale nettverk, dyp læring og CNN-er.

Dette emnet gjør forsterkende læring tilgjengelig, og utstyrer deg med verktøy og innsikt for å bruke disse ferdighetene til virkelige utfordringer og innovasjoner.

Forkunnskapskrav

Ingen

Anbefalte forkunnskaper

DAT120 Grunnleggende programmering, DAT540 Introduksjon til datavitenskap, STA500 Sannsynlighetsregning og statistikk 2

Eksamen / vurdering

Prosjektrapport og muntlig eksamen

Vurderingsform Vekting Varighet Karakter Hjelpemiddel
Prosjektrapport (gruppe) 1/2 Bokstavkarakterer
Muntlig eksamen 1/2 Bokstavkarakterer Ingen hjelpemidler tillatt

Det gjennomføres to separate vurderinger for gjennomføring og karakterer: gruppeprosjekt og individuell muntlig eksamen- Prosjektet gjennomføres i tildelte grupper, som vil bli annonsert ved oppstart av prosjektperioden.Prosjektvurderingen, inkludert rapport med kildekode, utgjør 50 % av sluttkarakteren. Studentene får tre uker på seg til å fullføre prosjektet, og alle gruppemedlemmene vil få samme karakter.- I tillegg vil hver student ha en 30-minutters individuell muntlig eksamen, som bidrar med de resterende 50 % av karakteren. Denne eksamen vil vurdere hver students forståelse og anvendelse av kursmaterialet.Dersom en student ikke består verken prosjektet eller muntlig eksamen, må vedkommende ta den/de relevante komponentene på nytt når emnet tilbys neste gang.Eventuelt fravær på grunn av sykdom eller andre årsaker skal meldes til faglærer og eksamenskontoret snarest.

Vilkår for å gå opp til eksamen/vurdering

Innlevereingsoppgaver

Fagperson(er)

Instituttleder:

Tom Ryen

Arbeidsformer

Arbeidet vil bestå av 4 timer forelesning og 2 timer planlagt laboratorium. Studentene forventes å bruke ytterligere 4-8 timer i uken på selvstudium, gruppediskusjoner og utviklingsarbeid.

Åpent for

Enkeltemner ved Det teknisk-naturvitenskaplige fakultet
Data Science - master i teknologi/siv.ing.
Utveksling ved Det teknisk- naturvitenskapelige fakultet

Emneevaluering

Det skal være en tidligdialog mellom emneansvarlig, studenttillitsvalgt og studentene. Formålet er tilbakemelding fra studentene for endringer og justering i emnet inneværende semester.I tillegg skal det gjennomføres en digital emneevaluering minimum hvert tredje år. Den har som formål å innhente studentenes erfaringer med emnet.

Litteratur

Søk etter pensumlitteratur i Leganto