Google tilbyder gratis metadatasæt med få-shot Deep Learning AI og maskinindlæringsalgoritmer til hurtig og effektiv billedklassificering i TensorFlow og PyTorch

Tech / Google tilbyder gratis metadatasæt med få-shot Deep Learning AI og maskinindlæringsalgoritmer til hurtig og effektiv billedklassificering i TensorFlow og PyTorch 2 minutter læst

Google Pixel 5?



Google har annoncerede tilgængeligheden af ​​flere datasæt bestående af forskellige, men begrænsede naturlige billeder. Søge giganten er overbevist om, at de offentligt tilgængelige data vil føre tempoet Maskinindlæring og kunstig intelligens samtidig med at det reducerer den tid, det tager at træne AI-modellerne på en minimal mængde data. Google kalder det nye initiativ 'Gratis metadatasæt', der hjælper AI-modeller med at 'lære' om færre data. 'Few-Shot AI' fra virksomheden er optimeret til at sikre, at AI lærer nye klasser fra kun få repræsentative billeder.

Forståelse for behovet for hurtigt at træne AI- og Machine Learning-modeller med færre datasæt, har Google lanceret 'Meta-datasæt', en lille samling billeder, der skal hjælpe med at reducere mængden af ​​data, der er nødvendige for at forbedre nøjagtigheden af ​​algoritmer. Virksomheden hævder, at AI- og ML-modellerne ved hjælp af få-shot-billedklassificeringsteknikker får den samme indsigt fra meget færre repræsentative billeder.



Google AI annoncerer metadatasæt: et datasæt af datasæt til få-shot læring:

Deep Learning for AI og Machine Learning har vokset eksponentielt i nogen tid. Imidlertid er kernekravet tilgængeligheden af ​​data af høj kvalitet og det også i store mængder. De store mængder manuelt kommenterede træningsdata er ofte vanskelige at skaffe og kan undertiden også være upålidelige. Forståelse for risiciene ved store datasæt har Google annonceret tilgængeligheden af ​​en samling metadatasæt.



Igennem ' Meta-datasæt: Et datasæt af datasæt til læring at lære af få eksempler ”(Præsenteret kl ICLR 2020 ), Har Google foreslået et stort og forskelligt benchmark til måling af forskellige billedklassificeringsmodelers kompetence i en realistisk og udfordrende få-shot-indstilling, der tilbyder en ramme, hvor man kan undersøge flere vigtige aspekter af klassificering med få skud. I det væsentlige tilbyder Google 10 offentligt tilgængelige og gratis at bruge datasæt med naturlige billeder. Disse datasæt består af ImageNet, CUB-200-2011, Fungi, håndskrevne tegn og doodles. Koden er offentlig og inkluderer en notesbog det viser, hvordan Meta-datasæt kan bruges i TensorFlow og PyTorch .



Få-shot klassifikation går ud over standarduddannelse og dyb læringsmodeller . Det tager generalisering til helt nye klasser på testtidspunktet. Med andre ord blev de billeder, der blev brugt under testningen, ikke set under træning. I en klassificering med få skud indeholder træningssættet klasser, der er helt adskilt fra dem, der vises på testtidspunktet. Hver testopgave indeholder en support sæt af et par mærkede billeder, hvorfra modellen kan lære om de nye klasser og en sammenhæng forespørgselssæt af eksempler, som modellen derefter bliver bedt om at klassificere.

Et metadatasæt er en stor komponent, hvori model studerer generalisering til helt nye datasæt , hvorfra der ikke blev set nogen billeder af nogen klasse under træning. Dette er ud over den hårde generaliseringsudfordring for nye klasser, der er forbundet med læringsopsætningen med få skud.

Hvordan hjælper metadatasæt med dyb læring til AI- og maskinindlæringsmodeller?

Meta-datasæt repræsenterer det største organiserede benchmark for krydsdatasæt, få-shot billedklassificering til dato. Det introducerer også en samplingsalgoritme til generering af opgaver med forskellige karakteristika og vanskeligheder ved at variere antallet af klasser i hver opgave, antallet af tilgængelige eksempler pr. Klasse, indføre klasse ubalancer og for nogle datasæt at variere graden af ​​lighed mellem klasser for hver opgave.



Meta-datasæt introducerer nye udfordringer for en klassificering med få skud. Googles forskning er stadig foreløbig, og der er meget grund til at dække. Søgekæmpen har imidlertid hævdet, at forskere oplever succes. Nogle af de bemærkelsesværdige eksempler inkluderer brug af smart designet opgave konditionering , mere sofistikeret hyperparameter tuning , til ' meta-baseline 'Der kombinerer fordelene ved præ-træning og metalæring og endelig brug valg af funktion at specialisere en universel repræsentation for hver opgave.

Mærker google