Microsoft annoncerer TextWorld til træning og evaluering af RL-agenter på tekstbaserede spil

Microsoft / Microsoft annoncerer TextWorld til træning og evaluering af RL-agenter på tekstbaserede spil 2 minutter læst

TextWorld grafisk nøgle - Microsoft



Tekstbaserede spil er kommet frem som den perfekte måde at teste kunstigt intelligente maskiner ud. På dette tidspunkt, selvom kunstig intelligens er veludviklet på sensorisk front, til kun at teste en maskines kognitive kapaciteter, skiller tekstbaserede spil sig ud som den førende metode til at måle nøjagtigt, hvordan en maskine forstår, analyserer og derefter reagerer på et problem scenarie. Microsofts TextWorld er en opensource Python-baseret ramme, der genererer tilfældigt designede unikke tekstproblemer, der gør det muligt for techudviklere at observere, hvordan deres AI-enheder lærer og bevarer deres læring ved at bruge sprog til forståelse og besvarelse samt ved hjælp af hurtig beslutningstagning i et domæne af sæt betingelser og muligheder for sving. Dette projekt fremføres af Microsofts erhvervede FATE AI-laboratorium i Montreal, og produktet er siden blevet gjort tilgængeligt på deres websted til gratis download fra den 12. juli 2018.

TextWorld-spil-simuleringsprompt. Microsoft



Som TextWorld står nu, finder problemerne sted i et hus. Dette er begrænset for at gøre det muligt for AI at få fortrolighed med sit miljø, så dets forsøg på efterfølgende problemer også kan reflektere over dets tilbageholdelse af, hvad der blev lært i løsningerne på tidligere. De fleste af problemerne drejer sig om grundlæggende hjemmearbejdsopgaver som at transportere genstande rundt, interagere med forskellige dele af huset og udføre daglige opgaver. Dette simuleringsspil fungerer som en legeplads til at teste og udvikle AI til læringsretention og effektiv beslutningstagning. I tilfælde af dette spil arbejder de to komponenter i spilgeneratoren og spilmotoren hånd i hånd. Førstnævnte skaber grænser for spillet at udvikle sig i. Disse grænser inkluderer antallet af værelser, historier, objekter og mål, der skaber den indstilling, som spillet finder sted i, og bestemmer, hvad der er nødvendigt for at besejre spillet med succes. Spilmotoren bruger derefter disse forudindstillede betingelser til at skabe spilspecifikke scenarier for det faktiske spil, der følger en enkelt kommandoparseringsmekanisme i binære moduler, der gør det muligt for spillet at bevæge sig frem, når det korrekte svar er startet eller bevæge sig baglæns, hvis en konsekvens af det forkerte svar skal udføres. Implikationerne af konsekvenser kræver, at maskinen, der spiller spillet, ikke kun beslutter det rigtige sæt svarskommandoer, men også den korrekte rækkefølge og den korrekte timing for at gå glat fremad gennem gåderne. Ekstra spillere er endnu ikke en del af spillet



Da mange AI-udviklere har testet spillet, er bekymringen stadig, at nogle af scenarierne og kommandoerne i spillet er ret ufuldstændige for, at maskinen kan træffe beslutninger om. Nogle scenarier i spillet anses også for at være 'for lette', men til det formål, de tjener, som det er, engagerer spillet erkendelsescentre for maskiner med kunstig intelligens. Tekniske eksperter på Microsofts base i Montreal er begejstrede for at se konsekvenserne af deres udviklede spil, og mange AI-udviklere skynder sig at afslutte deres produkter til test i et åbent topmøde i årets IEEE-konference om beregningsintelligens og spil (CIG) om den 20thjuli i år. Topmødet vil indeholde en konkurrence, der tester AI-maskiner mod dette spil, og dette er den bedste mulighed for individuelle startups og private udviklere til at teste deres produkter mod en fast industristandard.



Præsentation på IEEE Conference on Computational Intelligence and Games. IEEE CIG