Google taler om vigtigheden af ​​open source og open data i et nyligt blogindlæg

Tech / Google taler om vigtigheden af ​​open source og open data i et nyligt blogindlæg 3 minutter læst

Google



Google som firma har altid været til støtte for open source-software og data, i det mindste i deres stand. Det er næsten en tendens med store virksomheder nu, da både Google og Microsoft har ydet markante bidrag til open source-scenen. “ Google er også en stor bidragyder til open source-software. Nøgleeksempler på dette inkluderer Android , vores smartphone-operativsystem, Krom , kodebasen for vores Chrome-browser (nu også styrker mange konkurrenter ) og TensorFlow , vores maskinlæringssystem. Googles frigivelse af Guvernører ændret cloud hosting for evigt og har muliggjort innovation og konkurrence på tværs af skybranchen. Google er også den største bidragyder af open source-kode til GitHub , et delt lager til softwareudvikling. I 2017 foretog Googlers mere end 250.000 ændringer i titusinder af projekter alene på GitHub. '

I de fleste tilfælde handler det ikke rigtig om generøsitet, men mere om at drage fordel af gratis udvikling og derefter drage fordel af bred vedtagelse. Uanset hvad har disse bidrag hjulpet tusinder af forskere og har ført softwareudvikling på en ensartet måde, som skal fejres. Google i en nylig blogpost fremhævede deres bidrag til open data og open source software.



Med fremkomsten af ​​realtidssporing og udvikling af førerløse biler udføres der en masse forskning inden for computersyn, og Google er et af de virksomheder, der er i front inden for Visual Tech.



Vores forpligtelse til open source og open data har ført os til at dele datasæt, tjenester og software med alle. For eksempel frigav Google Åbn datasættet på 36,5 millioner billeder, der indeholder næsten 20.000 kategorier af menneskemærkede genstande. Med disse data kan forskere i computersyn træne billedgenkendelsessystemer. Tilsvarende er de millioner af kommenterede videoer i YouTube-8M samling kan bruges til at træne videogenkendelse.



- Variant ting

Chief Economist, Google

Google sidder også på en masse data, som kan hjælpe NLP-forskning og hjælpe computere med bedre at forstå menneskelig tale. I blogindlægget fremhævede Google delingen af ​​en nøgledatabase med angivelse af “ Med hensyn til sprogbehandling har vi delt Naturlige spørgsmål database, som indeholder 307.373 menneskeskabte spørgsmål og svar. Vi har også gjort tilgængelige for Trillion Word Corpus , som er baseret på ord, der bruges på offentlige websider, og Ngram Viewer , der kan bruges til at udforske de mere end 25 millioner bøger i Google Bøger . Disse samlinger kan bruges til statistisk maskinoversættelse , tale genkendelse, stavekorrektion , enhedspåvisning, informationsudvinding og anden sprogforskning. ”



Søgemaskinen er en af ​​Googles kerneforretninger og får over 63.000 forespørgsler hvert sekund. Disse data er meget vigtige for virksomheden, og Google analyserer disse data til målrettet reklame. Alligevel offentliggøres nogle indblik i de samlede data i Googles trendsportal.

' Google tilbyder også Google Trends , en gratis tjeneste, der gør det muligt for enhver at se og downloade samlet søgeaktivitet siden 2004 til Google-søgning, billedsøgning, nyhedssøgning, shopping og YouTube. Du kan få søgeoplysninger for lande, regioner, metroområder og byer på en månedlig, ugentlig, daglig og endda timesbasis. Trends-dataene anvendes i vid udstrækning af forskere inden for så forskellige områder som medicin og økonomi. Ifølge Google Scholar er der mere end 21.000 forskningsopgaver der citerer Trends som datakilde. ”

Hvorfor arbejde på open source-projekter?

Jeg talte kort om dette i begyndelsen af ​​artiklen. Et nyt stykke software kan implementere en god idé og innovere rummet, men det forhindrer ikke andre i at implementere lignende ideer og derefter arbejde på at gøre det bedre. Mange virksomheder har lært det på den hårde måde, for eksempel Windows Phone. Som vi ved var det en rungende fiasko og af mange grunde, men at have et lukket miljø og kontrollere licens var en stor del af det. Hardoop og HDFS var open source-versioner af MapReduce bygget af Google, og virksomheden lærte tidligt vigtigheden af ​​open source. Sammenfattende er beslutningen om at lave en IP-open source en strategisk beslutning.

Google fordyber sig i et par andre grunde i sit blogindlæg med angivelse af “ Først og fremmest er vores primære mission 'at organisere verdens information og gøre den universel tilgængelig og nyttig.' Bestemt en åbenbar måde at gøre oplysninger universelt tilgængelige og nyttige på er at give dem væk ! '

De taler også om, hvorfor de ikke kan frigive nogle ting, der siger ' Naturligvis kan vi ikke frigive alle de data, vi bruger i vores forretning. Vi er nødt til at beskytte brugernes privatliv, opretholde fortrolighed for forretningskunder og beskytte Googles egen intellektuelle ejendom. Men med forbehold af sådanne overvejelser forsøger vi generelt at gøre vores data så “universelt tilgængelige og nyttige” som muligt. '

Mærker google