Programmereren Hadley Wickham utpeker mangfoldet av R-samfunnet

De mest etterspurte programmeringsspråk og utviklerjobber over hele kloden Disse kodingsspråkene er de mest etterspurte blant selskaper, ifølge en Hired-rapport.

Hadley Wickham er en del av en voksende bevegelse av statistikere og dataforskere som forkynner evangeliseringen av R som et praktisk, brukervennlig verktøy for dataanalyse.

Må-lese utviklerinnhold

  • Java og JavaScript dominerte programvareutvikling på 2010-tallet
  • Hvordan bli utvikler: Et jukseark
  • 10 måter å forhindre utbrenthet av utviklere (gratis PDF)
  • Python spiser verden: Hvordan en utviklerens sideprosjekt ble det hotteste programmeringsspråket på planeten

Wickham er hjernen bak den populære dplyr-pakken, som gjør det lettere å manipulere data. Han har utviklet eller co-utviklet andre, inkludert tibble, ggplot2, lim og pilar.

Mange blir brukt mye av selskaper som The New York Times, Facebook og Google. Hans fans har til og med kalt kreasjonene hans den ryddige.

Seks programmeringsspråk etterspurt: komme i gang (gratis PDF)

"Til å begynne med var det et språk som først og fremst ble brukt av statistikere, så antakelsen var at folk som bruker R hadde en doktorgrad i statistikk, " sa Wickham. "Med fremveksten av datavitenskap har populariteten til R massivt utvidet. Mange mennesker fra mange forskjellige bakgrunner og mange forskjellige domener bruker det nå for å finne ut hva som skjer med dataene dine."

"Det som virkelig trakk meg til R var den fleksibiliteten og kraften det gir deg å virkelig bryte med dataene dine og stille dem spørsmål og finne ut hva som skjer på en veldig flytende og interaktiv måte, " la han til.

Programmeringen går i blodet fra Wickham, ettersom faren og søsteren har doktorgrader i statistikk. Han startet med R-språket for 15 år siden da han var studentereksamen ved University of Auckland, hvor R ble opprettet av statistikerne Ross Ihaka og Robert Gentleman i 1993.

Wickham er nå sjefforsker ved RStudio og tjener som adjunkt professor i statistikk ved University of Auckland, Stanford University og Rice University. Arbeidet hans med R har gjort ham til noe av en kjendis innen datavitenskapfeltet, med mange av fansen hans som oversvømmer forum med takknemlighet for pakkene hans.

Verktøyene hans har forenklet den noe arkane koden som er nødvendig for å håndtere ting som datasamling og plotting. Dette har gjort R anvendelig for nesten alle bransjer som trenger en måte å organisere data på.

Wickham sa at han fikk æren av å se folk hos offentlige etater som Food and Drug Administration og selskaper som FiveThirtyEight og Twitter brukte pakkene hans. Han fremhevet Rs adopsjon av farmasøytiske selskaper, som bruker den til å designe og analysere resultatene fra kliniske studier og andre deler av legemiddelfunnledningen.

"En haug med folk i økonomi bruker det, så vel som forsikring og akademia. Hvis du er involvert i noen disiplin som samler inn data, fungerer det. Det blir mer populært innen økonomi, og mange biologer og økologer bruker det. Det er nyttig for mennesker som ikke har en tradisjonell kvantitativ bakgrunn, men som nå må bryte med data. Journalister er et godt eksempel, "sa han.

"En del av det er at det ble designet av statistikere. Hjertet i språket er designet spesielt for de typene problemer du støter på med dataanalyse."

Wickham, opprinnelig fra Hamilton, New Zealand, har jobbet med databaser siden han var 15 år, og utviklet Microsoft Access-databaser.

Ggplot2-pakken hans - en av de mest populære - er lastet ned av millioner som roser muligheten for å hjelpe til med å administrere datavisualisering. Målet med så mange av pakkene hans er å fjerne den harde delen og gjøre det lettere for flere å ha tilgang til verktøy som forenkler dataene deres.

Hans mål for fremtiden er å fortsette utvidelsen av R over hele verden for å diversifisere bassenget av mennesker som bruker den. En ulempe, sa han, er at det kan være vanskelig å bruke R uten å snakke engelsk.

Grupper oversetter nå noen av bøkene hans om R til spansk og andre språk, slik at flere kan få fotfeste i å forstå det.

"En av tingene jeg er interessert i er å sørge for at alle som ønsker å bruke R kan bruke R. Jeg dro til Latin-R-konferansen i Chile og spurte meg selv: 'Hvordan kan vi hjelpe folk som ikke har det første språket? Engelsk bruker R? '"Sa han.

"Så et samfunn i Latin-Amerika oversatte nylig boken min 'R for Data Science' til spansk, og en av de pene tingene de gjorde, er at de også oversatte noen av datasettene, slik at navnene på datasettene og navnene på variabler er også på spansk. "

Han håper det kan være mer samhandling og utforskning mellom R og noen av de andre konkurrerende språkene som SQL og Python. Ideen, sa han, burde være å forenkle den slik at hvem som helst kan bruke disse verktøyene til alle slags data. Han spøkte med at han til og med skrapte data fra yogaklassen sin og kunne leke med dem ved å bruke R.

Det er mange mennesker som ikke er programmerere, statistikere eller matematikere, men som blir tvunget til å håndtere data.

"Hvordan kan vi hjelpe disse menneskene til å lære R gjennom en slags kombinasjon av bedre verktøy som er bedre å forstå og lettere å lære og bedre undervisning og bedre ressurser, " sa han.

Den ganske nylige populariseringen av R-språket har gjort brukerbasen til en av de mest mangfoldige, med lokalsamfunn over hele verden og et spesielt stort samfunn av kvinner, som har kalt seg R-Ladies.

"Det som er spesielt med R-samfunnet, er R-damesamfunnet, som er en relativt ny ting. En haug med møter rundt om i verden er nå rettet mot kvinner og andre kjønns minoriteter, " sa han.

"Det har virkelig hatt innvirkning på kjønnsdiversiteten i R-samfunnet."

Ukens nyhetsbrev med åpen kildekode

Du vil ikke gå glipp av våre tips, opplæringsprogrammer og kommentarer til Linux OS og open source applikasjoner. Leveres tirsdager

Registrer deg i dag

© Copyright 2021 | pepebotifarra.com