Proiecte RStudio pentru începători [2022]

Publicat: 2021-01-10

În articolul următor, vorbim despre proiectele RStudio, ce sunt acestea, de ce ar trebui să le folosiți și cum le puteți utiliza. Am discutat, de asemenea, câteva bune practici privind proiectele RStudio, astfel încât să puteți lucra cu ele rapid și eficient. Să începem.

Cuprins

Ce este RStudio?

RStudio este un IDE (Integrated Development Environment) pentru R, unul dintre cele mai importante limbaje de programare în analiza datelor. Are o consolă, un editor, precum și multe instrumente pentru depanare, trasare și gestionarea spațiului de lucru. Are atât ediții open source, cât și ediții comerciale disponibile pe piață și îl puteți utiliza cu sistemele de operare Mac, Linux și Windows. Are și o versiune online pe care o puteți accesa prin browser.

Este un mediu de dezvoltare și vă ajută să utilizați R pentru calculul statistic. Pentru a utiliza RStudio, ar trebui să fiți familiarizat cu R, limbajul de programare. Iată un tutorial detaliat despre R , dacă sunteți interesat.

De ce să folosiți Rstudio Projects?

Există o greșeală comună pe care mulți analiști o fac în timp ce lucrează cu RStudio. Metoda convențională de setare a directoarelor de lucru este utilizarea setwd(). Problema cu abordarea tradițională este că creează o cale absolută a fișierului ca intrare și setează la fel ca directorul de lucru. Pentru a accesa analiza datelor, trebuie să utilizați getwd().

Având o cale absolută a fișierului, directorul dvs. de lucru este foarte vulnerabil la întreruperea legăturilor. Link-ul directorului tău se poate rupe cu ușurință în această metodă, ceea ce face ca partajarea acestui proiect cu alții să fie foarte dificilă. De exemplu, dacă mutați lista doar într-un subdosar, legătura acesteia se va întrerupe. Putem spune că, având o cale absolută a fișierului, este aproape imposibil să vă împărtășiți munca cu alții.

Mai mult, ca analist de date, ar trebui să lucrezi în echipă, cu alți profesioniști. Deci, ar trebui să-ți împărtășești munca cu alții și să colaborezi.

Aflați mai multe: R Tutorial pentru începători: Deveniți un expert în programare R

Soluția

În loc să urmați calea ortodoxă a utilizării setwd(), puteți crea proiecte RStudio și puteți elimina toate problemele. Proiectele Rstudio fac calea fișierului relativă, în loc de absolută, ceea ce ajută la păstrarea în siguranță a căii fișierului. Când creați proiecte RStudio, acestea adaugă extensia.Rproj la fișierul dvs.

Cu această extensie, ori de câte ori RStudio rulează prin acest fișier, directorul său de lucru indică folderul în care este salvat. Aceasta înseamnă că, chiar și atunci când vă mutați fișierul de proiect într-un subdosar sau într-o altă locație, acesta va rămâne accesibil.

Ar trebui să urmați această metodă doar pentru a crea și salva sesiunile dvs. RStudio. Nu numai că vă va ajuta să faceți fișierul accesibil, dar vă va ajuta și să partajați altora. Nu ar trebui să vă faceți griji că calea fișierului va fi ruptă așa cum ați fi făcut-o cu abordarea anterioară, adică atunci când ați folosi setwd().

Evitarea abordării tradiționale ți se poate părea descurajantă, dar nu-ți face griji. Această metodă este mai bună în multe privințe, așa cum am stabilit mai devreme. Acum că știți de ce ar trebui să utilizați proiectele RStudio, acum ar trebui să discutăm cum le puteți utiliza.

Cum se creează proiecte RStudio

Pentru a crea un proiect RStudio, mai întâi trebuie să utilizați opțiunea „Creare Project”, pe care o puteți accesa prin bara de instrumente globală selectând meniul Proiecte de acolo.

După ce selectați opțiunea „Creați proiect”, RStudio creează un fișier proiect cu extensia .Rproj în directorul de lucru. De asemenea, creează o listă ascunsă sub numele .Rproj, utilizator unde stochează toate fișierele temporare legate de proiect precum .gitignore. Apoi, încarcă proiectul în RStudio și își afișează numele în bara de instrumente.

Odată ce ați creat proiectul, ar trebui să utilizați numai fișierele prezente în acel director, cu excepția cazului în care proiectul dvs. necesită utilizarea unui instrument bazat pe Internet (apelarea unui API sau efectuarea de web-scraping). Puteți crea proiecte RStudio într-o listă existentă sau într-o înregistrare nouă. Să trecem acum la modul în care puteți utiliza aceste proiecte:

Cum să lucrați cu proiectele RStudio

Cel mai bine ar fi să vă începeți întotdeauna munca prin deschiderea fișierului .Rproj și să deschideți alte date după aceea, ceea ce este cea mai bună practică. Pentru a deschide un fișier .Rproj, puteți deschide RStudio și utilizați opțiunea „Deschidere proiect” prezentă în meniul Proiecte din bara de instrumente. Când ați selecta acea comandă, veți vedea o listă cu proiectele create de dvs., din care puteți alege pe cel la care doriți să lucrați.

RStudio creează o nouă sesiune R atunci când deschideți un proiect. De asemenea, încarcă fișierul .RData prezent în directorul de lucru (dacă proiectul o cere) împreună cu un fișier .Rhistory în panoul său Istoric. RStudio restabilește, de asemenea, toate setările aferente (pozițiile splitterului, filele active etc.) acolo unde erau când ați închis proiectul în ultima sesiune. După cum ați observat până acum, utilizarea proiectelor RStudio este ușor mai bună decât utilizarea metodei tradiționale.

Cel mai bine ar fi dacă ați lua în considerare deschiderea fișierului .Rproj ca inițializare a întregii sarcini. Se asigură că directorul dvs. de lucru funcționează fără probleme și eficient. De asemenea, vă ajută să evitați orice erori legate de fluxul dvs. de lucru.

Citiți: 6 idei interesante de proiecte R pentru începători.

Cum să structurați directorul de proiecte

Pe lângă utilizarea proiectelor RStudio, iată un scurt ghid despre cum să structurați directorul de proiecte pentru o gestionare și o gestionare eficiente.

Date

În primul rând, ar trebui să aveți un subdosar Date în care salvați toate fișierele pe care trebuie să le citiți în R pentru a efectua vizualizarea sau analiza necesară. Cu alte cuvinte, acest folder este pentru stocarea tuturor fișierelor sursă.

Scenariul

În acest folder, ar trebui să stocați toate scripturile R și toate fișierele cu extensiile .Rmd și .R. Poate avea următoarele subdosare:

  • Fișiere

Aici stocați toate fișierele cu extensii .Rmd și .R (numite și fișiere RMarkdown)

  • Funcții

Aici stocați toate funcțiile personalizate pe care le-ați creat. Este optional.

  • Analiză

Aici stocați toate scripturile R originale pentru proiectul dvs. Acest folder ar fi util atunci când ați avea mai multe fișiere de analiză de utilizat într-un singur proiect.

Învață cursuri de știință a datelor de la cele mai bune universități din lume. Câștigă programe Executive PG, programe avansate de certificat sau programe de master pentru a-ți accelera cariera.

Ieșire

În acest folder, ar trebui să stocați toate fișierele pe care le creați în proiectele dvs., cum ar fi HTML, ploturi și exporturi. Acest folder are și multe avantaje. În primul rând, îi ajută pe alții să afle unde sunt rezultatele codului tău. În al doilea rând, ajută la separarea tuturor fișierelor sursă și a datelor la care ați lucrat.

Citește și: 8 proiecte uimitoare de știință a datelor în R pentru începători

Concluzie

Sperăm că v-a plăcut acest ghid despre proiectele RStudio. Dacă doriți să aflați mai multe despre R, limbajul de programare și RStudio, atunci vă recomandăm să mergeți la blogul upGrad, unde veți găsi multe resurse, ghiduri și articole valoroase.

Pe de altă parte, dacă doriți să obțineți o experiență de învățare mai aprofundată, atunci ar trebui să obțineți un curs de știință a datelor.

Ce este RStudio și de ce îl folosim pentru a construi proiecte?

RStudio este un mediu de dezvoltare integrat sau IDE pentru limbajul R. Este unul dintre cele mai populare IDE-uri pentru R și oferă o consolă, un editor, instrumente pentru depanare, trasare și gestionarea spațiului de lucru. Unul dintre principalele motive pentru popularitatea sa este că are două ediții disponibile pe piață - open source și comercială, ceea ce face convenabil pentru utilizator să construiască proiecte folosindu-l fără a plăti nimic. În plus, îl puteți folosi chiar și fără a descărca start-up-ul folosind versiunea de browser.

Care ar trebui să fie structura directorului de proiecte?

În afară de realizarea proiectelor, este esențial modul în care vă structurați directorul de proiecte pentru o manipulare eficientă și lizibilitate de către utilizator. Următoarea este structura ideală în care trebuie să vă păstrați fișierele: Primul folder ar trebui să fie folderul Data care va conține toate fișierele sursă ale proiectului dumneavoastră. În continuare, folderul de scripturi va conține toate scripturile R și fișierele cu extensiile .Rmd și .R. Acest folder va avea în continuare următoarele subdosare. Dosarul Fișiere va conține toate fișierele cu extensii precum .Rmd și .R. Aceste fișiere sunt cunoscute și ca fișiere Rmarkdown . Folderul Funcții este opțional. Dacă ați creat orice funcție personalizată, puteți stoca fișierul acesteia în acest folder. Dosarul de analiză devine util atunci când aveți o mulțime de fișiere de analiză de utilizat într-un singur proiect. Puteți stoca scripturile R originale în acest folder.

Care sunt aplicațiile limbajului R?

R este un limbaj popular și este utilizat pe scară largă în mai multe domenii. Dacă aveți un fundal statistic, poate fi chiar mult mai ușor decât Python pentru dvs. Unele dintre aplicațiile limbajului R sunt enumerate mai jos: R este foarte popular în domeniul financiar, deoarece oferă o suită statistică avansată pentru a îndeplini toate sarcinile financiare. La fel ca și Finanțe, sistemele bancare folosesc și limbajul R pentru analiza riscului, cum ar fi modelarea riscului de credit. Alte domenii precum asistența medicală și rețelele sociale folosesc, de asemenea, R în mai multe scopuri.