Robots programmeren voor taken in huishoudens of in de zorg is tijdrovend en lastig. Een efficiëntere aanpak zou kunnen zijn om de robots het in de praktijk zelf te laten leren. Bijvoorbeeld zichzelf leren lopen.
Dienstverlenende robots hebben de potentie om, op termijn, heel waardevol te zijn in huishoudens, de gezondheidszorg en in andere arbeidsintensieve omgevingen. Zulke omgevingen zijn echter meestal uniek, niet erg gestructureerd en aan verandering onderhevig, wat het lastig en tijdrovend maakt om dienstverlenende robots robuust en veelzijdig te maken via handmatig programmeren.
Zelflerend
Robots die (ter plekke) zelf leren om taken te vervullen door interactie met de echte wereld, kunnen daarom een aantrekkelijk alternatief zijn. Met Reinforcement Learning (RL) kan een systeem leren om taken op te lossen op basis van terugkoppeling op zijn gedrag: goed gedrag wordt versterkt door positieve beloningen, slecht gedrag wordt bestraft door negatieve beloningen. Wetenschappers onderzochten de kansen en mogelijkheden van een dergelijke aanpak voor echte robots.
Leo
Meestal wordt dit soort onderzoek louter gedaan via simulaties. ‘Er is nog weinig bekend over de aansluiting met echte, daadwerkelijke hardware’. ‘Het is een sterk punt van onze aanpak dat juist die combinatie wordt gemaakt.’ ‘We hebben een tweevoetige, lopende robot, genaamd Leo, speciaal ontworpen en gebouwd om onderzoek te doen naar het toepassen van Reinforcement Learning op echte robots. Robot Leo is in staat om twee motorische basistaken te leren: het plaatsen van een voet op een traptrede, en lopen.’
Positief
Om te leren lopen, ontvangt Leo een positieve beloning voor het vooruit bewegen van zijn voet, en negatieve beloningen voor het gebruik van tijd en energie. Die beloning is simpelweg een getalletje in de computer dat hoger of lager kan worden. Door uitproberen en bijsturen probeert Leo zijn beloningen te maximaliseren.
Lees meer:
TU Delft Robotics Institute
Delft Biorobotics Lab
Bron:
Technische Universiteit Delft
Laatste berichten
- 13:58 Standaardafwijking en variatiecoëfficiënt 1
- 10:53 terugkoppeling 13
- 23:06 raadsel: rolletjes 17
- 14 jun Biomassa 2
- 13 jun Randomisatie 7
- 13 jun fourier 8
- 12 jun Magnesium: cofactor voor ATP-verbruikende enzymen 1
- 12 jun Berkenen dwarskracht op buis 2
- 12 jun arbeid 6
- 12 jun Casus uit de praktijk: positief test THC 63
- 11 jun [wiskunde] Hoe maak je x vrij in 1/2(cos(4x))=cos(4x) 5
- 11 jun Muziektopic 1854
- 11 jun Straatklok loopt 5 minuten voor 22
- 10 jun hoogte 13
- 09 jun objecten 8
- 09 jun [wiskunde] Verwarring met som- en verschilformules 5
- 08 jun Wafer 7
- 07 jun Dark Energy 28
- 07 jun 'Seahenge' prehistorische poging om periode van klimaatverandering te keren?
- 07 jun EV laden met 8 vs 13 A 8