Datateknik, avancerad nivå, Reinforcement learning, 6 hp
Reinforcement learning är en maskininlärningsmetod som lär sig att lösa sekventiella beslutsfattande problem genom ”trial and error”. Detta innebär att en framgångsrik agent behöver fatta flera optimala beslut för att lösa problemet och att agenten måste lära sig av erfarenhet genom att knyta ihop olika lösningar. I den här kursen ger vi studenten grunden för att förstå och använda algoritmer för förstärkningsinlärningens diskreta och kontinuerliga miljöer, inklusive s.k. djup förstärkningsinlärning. Vi börjar med grundläggande dynamiska programmeringsbaserade algoritmer och inkluderar även state-of-the-art algoritmer för kontinuerliga tillstånd och aktionsutrymmen.
Kursen riktar sig till yrkesverksamma.
Fördjupning
Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav (A1N)
Institution
Institutionen för naturvetenskap och teknik
Kursen ges vid följande tillfällen
-
Förkunskapskrav: 180 högskolepoäng varav 15 högskolepoäng programmering samt Engelska 5/Engelska A.
Urval: Antal avklarade högskolepoäng tagna senast sista anmälningsdag (TPAV)
Anmälningskod: ORU-H5631