Reinforcement Learning (DAT605)
Dette emnet introduserer AI og optimalisering gjennom praktisk læring! Dette emnet gjør det enkelt og morsomt å takle optimaliseringsutfordringer, og viser deg hvordan du effektiviserer komplekse modeller, bygger smarte systemer som lærer og tar avgjørelser på egenhånd, og avdekker mønstre i data for å veilede bedre resultater. Få ferdigheter som gjelder for ulike felt, fra effektiv modelldesign til problemløsning i den virkelige verden.
Dette er emnebeskrivelsen for studieåret 2025-2026. Merk at det kan komme endringer.
Emnekode
DAT605
Versjon
1
Vekting (stp)
5
Semester undervisningsstart
Høst
Antall semestre
1
Vurderingssemester
Høst
Undervisningsspråk
Engelsk
Innhold
NB! Dette er et valgemne og kan avlyses dersom færre enn 10 studenter er påmeldt innen 20. august.
Vi bygger bro mellom veiledet og uovervåket læring. Mens overvåket læring er avhengig av merkede data og uovervåket læring søker skjulte mønstre uten etiketter, tar Reinforcement Learning (RL) en unik tilnærming. Den kombinerer læring fra eksempler med beslutningstaking i komplekse miljøer - å lære av erfaring for å ta optimale valg over tid.
I dette emnet vil du utforske det vesentlige av RL, fra funksjonstilnærming til avansert beslutningstaking. RL henter fra informatikk, psykologi og nevrovitenskap, noe som gjør det til et kraftig verktøy for et bredt spekter av applikasjoner, fra spill, spillteori og kontrollsystemer til sverm-intelligens og optimalisering.
Læringsutbytte
Dette emnet introduserer grunnleggende teori og praktiske programmeringsferdigheter i forsterkende læring (RL) på en engasjerende og tilgjengelig måte.
Kunnskap
Introduksjon til forsterkende læring: Få en solid forankring i RL og se hvordan det gjelder for beslutningstaking i den virkelige verden.
Ressurser og oppsett: Gjør deg kjent med kursmateriell og kodeverktøy. Et lynkurs om nevrale nettverk og rammeverk for dyp læring er også inkludert.
Kjernemetoder: Oppdag hvordan agenter lærer av sine valg og tilbakemeldinger for å ta smartere beslutninger.Lær av erfaring: Forstå hvordan agenter tilpasser seg og forbedrer seg basert på handlingene deres og belønningene de mottar.
Avanserte teknikker: Utforsk metoder som hjelper agenter med å ta effektive beslutninger, selv i komplekse situasjoner.
Ferdigheter
Programmeringsferdigheter
Grunnleggende om algebra, sannsynlighet og statistikk
Kjennskap til Python, Numpy og Matplotlib
Generell kompetanse
Få en grunnleggende forståelse av nevrale nettverk, dyp læring og CNN-er.
Dette emnet gjør forsterkende læring tilgjengelig, og utstyrer deg med verktøy og innsikt for å bruke disse ferdighetene til virkelige utfordringer og innovasjoner.
Forkunnskapskrav
Anbefalte forkunnskaper
Eksamen / vurdering
Prosjektrapport og muntlig eksamen
Vurderingsform | Vekting | Varighet | Karakter | Hjelpemiddel |
---|---|---|---|---|
Prosjektrapport (gruppe) | 1/2 | Bokstavkarakterer | ||
Muntlig eksamen | 1/2 | Bokstavkarakterer | Ingen hjelpemidler tillatt |
Det gjennomføres to separate vurderinger for gjennomføring og karakterer: gruppeprosjekt og individuell muntlig eksamen- Prosjektet gjennomføres i tildelte grupper, som vil bli annonsert ved oppstart av prosjektperioden.Prosjektvurderingen, inkludert rapport med kildekode, utgjør 50 % av sluttkarakteren. Studentene får tre uker på seg til å fullføre prosjektet, og alle gruppemedlemmene vil få samme karakter.- I tillegg vil hver student ha en 30-minutters individuell muntlig eksamen, som bidrar med de resterende 50 % av karakteren. Denne eksamen vil vurdere hver students forståelse og anvendelse av kursmaterialet.Dersom en student ikke består verken prosjektet eller muntlig eksamen, må vedkommende ta den/de relevante komponentene på nytt når emnet tilbys neste gang.Eventuelt fravær på grunn av sykdom eller andre årsaker skal meldes til faglærer og eksamenskontoret snarest.