Softwaresystemen van Alibaba en Microsoft hebben in een test begrijpend lezen voor het eerst beter gescoord dan mensen.
De hoog aangeschreven leestest werd ontwikkeld door de universiteit van Stanford in Californië om de vooruitgang van computers op het vlak van taal te meten. De leestest is gebaseerd op artikels van de encyclopediewebsite Wikipedia en is erop gericht grote hoeveelheden tekst inhoudelijk te verwerken. De test omvat meer dan 100.000 vragen over ruim 500 lemma's van Wikipedia. De computersystemen en de menselijke deelnemers moeten zo accuraat mogelijk antwoorden op vragen over wat ze op Wikipedia hebben gelezen. De vragen zijn heel uiteenlopend, en gaan van 'In welk jaar stierf Dzjengis Khan?' tot 'Welke band trad op tijdens de rust van de Super Bowl in 2016?'. (De antwoorden: 1227 en Coldplay.) De AI van Alibaba had een score van 82,44, een fractie beter dan het beste menselijke resultaat van 82,304. Microsoft haalde 82,65.
Patroonherkenning
'Dit is een primeur, maar het resultaat verrast ons niet. We zagen al langer stap voor stap de scores van AI verbeteren', zegt Yves Peirsman, expert in Natural Language Processing in Leuven. 'Het is wel niet zo dat computers nu beter kunnen lezen dan mensen. Het systeem doet vooral aan patroonherkenning: de AI laat zich voeden met grote hoeveelheden tekst en leert dan waar de antwoorden op de vragen staan. Dat is nog niet echt begrijpend lezen', zegt Peirsman. 'De software wordt vooral getraind om één taak tot een heel goed einde te brengen.' Toch kan dit leiden tot onmiddellijk bruikbare toepassingen, meent Peirsman. 'Denk vooral aan domeinen waarin mensen enorme hoeveelheden tekst moeten verwerken, zoals in de juridische of de medische wereld. Zulke technologie zou het mogelijk maken als het ware vragen te stellen aan teksten.'
Lees verder bij bron: De Tijd
Laatste berichten
- 23:19 Regenboogkleuren in Teylers Museum 1
- 23 mei Natriumbisulfaat ipv zwavelzuur 2
- 23 mei Temperatuur regelen met een onbetrouwbare fluctuerende energiebron. 14
- 23 mei [wiskunde] is dit toegestaan 2
- 22 mei 2022 Tandarts Vraag 9 fysica 3
- 22 mei HPLC, extra piek 1
- 21 mei [wiskunde] Hoe moet ik dit primitiveren? 8
- 20 mei wikkeling 3-fase , 4 polig, 12-draads generator 7
- 20 mei Magnesium: cofactor voor ATP-verbruikende enzymen
- 19 mei [wiskunde] Wat geeft de oppervlakte van een primitieve van een functie weer? 2
- 19 mei zuiger 3
- 19 mei Casus uit de praktijk: positief test THC 43
- 17 mei Sommatie reeks 5
- 16 mei bollen 13
- 16 mei Hoe kan ik deze magneet sectie voor lineare motor herhalen? 3
- 16 mei 2 nieuwe platen Mu-Metaal, wie weet waar ik dat kan verkopen? 1
- 16 mei elektrolyse 13
- 15 mei Nulpunten 4
- 15 mei 2 cogs-experiment variabele lichtsnelheid 29
- 15 mei [wiskunde] Waarom MOET het met behulp van de substitutie methode? 2
Nieuwsberichten
- 04 mar Een nieuw soort magnetisme: altermagnetisme
- 31 okt AI kan via stem diabetes vaststellen 11
- 21 okt Einstein krijgt wéér gelijk 45
- 07 feb witter dan wit 20
- 19 jun irrigatie en de aardas