Progetti RStudio per principianti [2022]

Pubblicato: 2021-01-10

Nel seguente articolo, parleremo dei progetti RStudio, di cosa sono, perché dovresti usarli e come puoi usarli. Abbiamo anche discusso diverse best practice relative ai progetti RStudio in modo da poter lavorare con loro in modo rapido ed efficiente. Iniziamo.

Sommario

Cos'è RStudio?

RStudio è un IDE (Integrated Development Environment) per R, uno dei linguaggi di programmazione più vitali nell'analisi dei dati. Ha una console, un editor e molti strumenti per il debug, la stampa e la gestione dell'area di lavoro. Ha sia edizioni open source che commerciali disponibili sul mercato e puoi usarlo con i sistemi operativi Mac, Linux e Windows. Ha anche una versione online a cui puoi accedere tramite il tuo browser.

È un ambiente di sviluppo e ti aiuta a usare R per il calcolo statistico. Per utilizzare RStudio, dovresti avere familiarità con R, il linguaggio di programmazione. Ecco un tutorial dettagliato su R , se sei interessato.

Perché usare i progetti Rstudio?

C'è un errore comune che molti analisti fanno mentre lavorano con RStudio. Il metodo convenzionale per impostare le directory di lavoro consiste nell'usare setwd(). Il problema con l'approccio tradizionale è che crea un percorso file assoluto come input e imposta lo stesso come directory di lavoro. Per accedere alla tua analisi dei dati, devi utilizzare getwd().

Avere un percorso file assoluto rende la tua directory di lavoro molto vulnerabile alle interruzioni dei collegamenti. Il collegamento della tua directory può interrompersi facilmente con questo metodo, il che rende molto complicato condividere questo progetto con altri. Ad esempio, se sposti l'elenco solo in una sottocartella, il relativo collegamento verrà interrotto. Possiamo dire che avere un percorso file assoluto rende quasi impossibile condividere il tuo lavoro con altri.

Inoltre, come analista di dati, dovresti lavorare in team, con altri professionisti. Quindi, dovresti condividere il tuo lavoro con gli altri e collaborare.

Ulteriori informazioni: Tutorial R per principianti: diventa un esperto di programmazione R

La soluzione

Invece di seguire il percorso ortodosso dell'utilizzo di setwd(), puoi creare progetti RStudio ed eliminare tutti i problemi. I progetti Rstudio rendono il percorso del file relativo, anziché assoluto, il che aiuta a mantenere sicuro il percorso del file. Quando crei progetti RStudio, aggiungono l'estensione .Rproj al tuo file.

Con questa estensione, ogni volta che RStudio esegue questo file, la sua directory di lavoro punta alla cartella in cui è stato salvato. Ciò significa che anche quando sposti il ​​file di progetto in una sottocartella o in un'altra posizione, rimarrebbe accessibile.

Dovresti seguire questo metodo solo per creare e salvare le sessioni di RStudio. Non solo ti aiuterà a rendere accessibile il tuo file, ma ti aiuterà anche a condividerlo con gli altri. Non dovresti preoccuparti che il percorso del file venga interrotto come avresti fatto con il primo approccio, cioè quando useresti setwd().

Evitare l'approccio tradizionale potrebbe sembrarti scoraggiante, ma non preoccuparti. Questo metodo è migliore in molti modi, come abbiamo stabilito in precedenza. Ora che sai perché dovresti usare i progetti RStudio, ora dovremmo discutere come puoi usarli.

Come creare progetti RStudio

Per creare un progetto RStudio, devi prima utilizzare l'opzione "Crea progetto", a cui puoi accedere tramite la barra degli strumenti globale selezionando il menu Progetti lì.

Dopo aver selezionato l'opzione "Crea progetto", RStudio crea un file di progetto con estensione .Rproj all'interno della directory di lavoro. Crea anche una lista nascosta sotto il nome .Rproj, utente dove memorizza tutti i file temporanei relativi al progetto come .gitignore. Quindi, carica il progetto in RStudio e ne visualizza il nome nella barra degli strumenti.

Una volta creato il progetto, dovresti utilizzare solo i file presenti in quella directory a meno che il tuo progetto non richieda l'utilizzo di uno strumento basato su Internet (chiamando un'API o eseguendo il web-scraping). Puoi creare progetti RStudio all'interno di un elenco esistente o in un nuovo record. Passiamo ora a come utilizzare questi progetti:

Come lavorare con i progetti RStudio

Sarebbe meglio se iniziassi sempre il tuo lavoro aprendo il file .Rproj e successivamente aprissi altri dati, che è la migliore pratica. Per aprire un file .Rproj, puoi aprire RStudio e utilizzare l'opzione 'Apri progetto' presente nel menu Progetti nella barra degli strumenti. Quando selezioni quel comando, vedrai un elenco dei tuoi progetti creati, da cui puoi scegliere quello su cui vuoi lavorare.

RStudio crea una nuova sessione R quando si apre un progetto. Carica anche il file .RData presente nella directory di lavoro (se il progetto lo richiede) insieme a un file .Rhistory nel suo pannello Cronologia. RStudio ripristina anche tutte le impostazioni relative (posizioni splitter, schede attive, ecc.) al punto in cui si trovavano quando avevi chiuso il progetto nell'ultima sessione. Come avrai già notato, l'utilizzo dei progetti RStudio è facilmente migliore rispetto all'utilizzo del metodo tradizionale.

Sarebbe meglio se considerassi l'apertura del file .Rproj come inizializzazione dell'intera attività. Garantisce che la directory di lavoro funzioni in modo fluido ed efficiente. Ti aiuta anche a evitare errori relativi al tuo flusso di lavoro.

Leggi: 6 interessanti idee per progetti R per principianti.

Come strutturare la tua directory di progetto

Oltre all'utilizzo dei progetti RStudio, ecco una breve guida su come strutturare la directory del progetto per una gestione e una gestione efficienti.

Dati

Innanzitutto, dovresti avere una sottocartella Dati in cui salvi tutti i file che devi leggere in R per eseguire la visualizzazione o l'analisi richiesta. In altre parole, questa cartella serve per memorizzare tutti i file di origine.

copione

In questa cartella, dovresti archiviare tutti gli script R e tutti i file con estensione .Rmd e .R. Può avere le seguenti sottocartelle:

  • File

Qui è dove memorizzi tutti i file con estensioni .Rmd e .R (chiamati anche file RMarkdown)

  • Funzioni

Qui è dove memorizzi tutte le funzioni personalizzate che hai creato. È facoltativo.

  • Analisi

Qui è dove memorizzi tutti gli script R originali per il tuo progetto. Questa cartella sarebbe utile quando avresti più file di analisi da utilizzare in un progetto.

Impara i corsi di scienza dei dati dalle migliori università del mondo. Guadagna programmi Executive PG, programmi di certificazione avanzati o programmi di master per accelerare la tua carriera.

Produzione

In questa cartella, dovresti archiviare tutti i file che crei nei tuoi progetti come HTML, grafici ed esportazioni. Anche questa cartella ha molti vantaggi. In primo luogo, aiuta gli altri a scoprire dove sono i risultati del tuo codice. In secondo luogo, aiuta a separare tutti i file di origine e i dati su cui hai lavorato.

Leggi anche: 8 sorprendenti progetti di scienza dei dati in R per principianti

Conclusione

Ci auguriamo che questa guida sui progetti RStudio ti sia piaciuta. Se vuoi saperne di più su R, il linguaggio di programmazione e RStudio, ti consigliamo di visitare il blog upGrad, dove troverai molte risorse, guide e articoli preziosi.

D'altra parte, se vuoi ottenere un'esperienza di apprendimento più approfondita, dovresti seguire un corso di scienza dei dati.

Cos'è RStudio e perché lo usiamo per costruire progetti?

RStudio è un ambiente di sviluppo integrato o IDE per il linguaggio R. È uno degli IDE più popolari per R e fornisce una console, un editor, strumenti per il debug, la stampa e la gestione dell'area di lavoro. Uno dei motivi principali della sua popolarità è che ha due edizioni disponibili sul mercato: open source e commerciale, il che rende conveniente per l'utente creare progetti utilizzandolo senza pagare nulla. Inoltre, puoi persino usarlo senza scaricare l'avvio utilizzando la sua versione del browser.

Quale dovrebbe essere la struttura della propria directory di progetto?

Oltre a creare progetti, è essenziale come strutturare la directory del progetto per una gestione efficiente e leggibilità dell'utente. Quella che segue è la struttura ideale in cui devi conservare i tuoi file: La prima cartella dovrebbe essere la cartella Dati che conterrà tutti i file sorgente del tuo progetto. Successivamente, la cartella degli script conterrà tutti gli script R e i file con estensione .Rmd e .R. Questa cartella conterrà inoltre le seguenti sottocartelle. La cartella File conterrà tutti i file con estensione come .Rmd e .R. Questi file sono anche conosciuti come file Rmarkdown . La cartella Funzioni è facoltativa. Se hai creato una funzione personalizzata, puoi archiviare il suo file in questa cartella. La cartella Analisi diventa utile quando si hanno molti file di analisi da utilizzare in un unico progetto. È possibile memorizzare gli script R originali in questa cartella.

Quali sono le applicazioni del linguaggio R?

R è un linguaggio popolare ed è ampiamente utilizzato in più domini. Se hai un background statistico, può anche essere molto più semplice di Python per te. Alcune delle applicazioni del linguaggio R sono elencate di seguito: R è molto popolare nel dominio finanziario poiché fornisce una suite statistica avanzata per svolgere tutte le attività finanziarie. Proprio come la finanza, anche i sistemi bancari utilizzano il linguaggio R per l'analisi del rischio come la modellazione del rischio di credito. Anche altri domini come l'assistenza sanitaria e i social media utilizzano R per molteplici scopi.