RStudio 初学者项目 [2022]

已发表: 2021-01-10

在接下来的文章中,我们将讨论 RStudio 项目、它们是什么、为什么要使用它们以及如何使用它们。 我们还讨论了有关 RStudio 项目的几个最佳实践,以便您可以快速有效地使用它们。 让我们开始吧。

目录

什么是 RStudio?

RStudio是 R 的IDE(集成开发环境) ,R 是数据分析中最重要的编程语言之一。 它有一个控制台、一个编辑器以及许多用于调试、绘图和管理工作区的工具。 它在市场上有开源和商业版本,您可以将它与 Mac、Linux 和 Windows 操作系统一起使用。 它也有一个在线版本,您可以通过浏览器访问它。

它是一个开发环境,它可以帮助您使用 R 进行统计计算。 要使用 RStudio,您应该熟悉编程语言 R。 如果您有兴趣,这里有一个关于 R 的详细教程

为什么使用 Rstudio 项目?

许多分析师在使用 RStudio 时常犯的错误。 设置工作目录的常规方法是使用 setwd()。 传统方法的问题在于它创建了一个绝对文件路径作为输入,并设置为与工作目录相同。 要访问您的数据分析,您必须使用 getwd()。

拥有绝对文件路径会使您的工作目录很容易受到链接中断的影响。 在这种方法中,您的目录链接很容易中断,这使得与其他人共享这个项目非常棘手。 例如,如果您将列表移动到仅一个子文件夹,则其链接将断开。 我们可以说,拥有绝对文件路径使您几乎不可能与他人分享您的工作。

此外,作为一名数据分析师,您必须与其他专业人士一起在团队中工作。 因此,您必须与他人分享您的工作并进行协作。

了解更多: R 初学者教程:成为 R 编程专家

解决方案

无需遵循使用 setwd() 的正统路径,您可以创建 RStudio 项目并消除所有麻烦。 Rstudio 项目使文件路径是相对的,而不是绝对的,这有助于保持文件路径的安全。 当您创建 RStudio 项目时,它们会将 .Rproj 扩展名添加到您的文件中。

有了这个扩展,每当 RStudio 运行这个文件时,它的工作目录就会指向保存它的文件夹。 这意味着即使您将项目文件移动到子文件夹或其他位置,它仍然可以访问。

您只应遵循此方法来创建和保存您的 RStudio 会话。 它不仅可以帮助您使文件易于访问,还可以帮助您与他人共享。 您不必像使用前一种方法(即使用 setwd() 时)那样担心文件路径会损坏。

避免传统方法对您来说似乎令人生畏,但不要担心。 正如我们之前建立的那样,这种方法在许多方面都更好。 既然您知道为什么应该使用 RStudio 项目,我们现在应该讨论如何使用它们。

如何创建 RStudio 项目

要创建 RStudio 项目,您首先必须使用“创建项目”选项,您可以通过选择那里的项目菜单通过全局工具栏访问该选项。

选择“创建项目”选项后,RStudio 会在工作目录中创建一个扩展名为 .Rproj 的项目文件。 它还在名称 .Rproj 下创建一个隐藏列表,用户在其中存储与项目相关的所有临时文件,例如 .gitignore。 然后,它将项目加载到 RStudio 中并在工具栏中显示其名称。

创建项目后,您应该只使用该目录中存在的文件,除非您的项目需要使用基于 Internet 的工具(调用 API 或执行网络抓取)。 您可以在现有列表或新记录中创建 RStudio 项目。 现在让我们继续讨论如何使用这些项目:

如何使用 RStudio 项目

最好总是从打开 .Rproj 文件开始工作,然后再打开其他数据,这是最佳做法。 要打开 .Rproj 文件,您可以打开 RStudio 并使用工具栏中“项目”菜单中的“打开项目”选项。 当您选择该命令时,您会看到已创建项目的列表,您可以从中选择要处理的项目。

当您打开项目时,RStudio 会创建一个新的 R 会话。 它还加载工作目录中存在的 .RData 文件(如果项目需要它)以及其历史记录窗格中的 .Rhistory 文件。 RStudio 还将所有相关设置(拆分器位置、活动选项卡等)恢复到您在上次会话中关闭项目时的位置。 正如您现在已经注意到的那样,使用 RStudio 项目比使用传统方法要好得多。

如果您考虑打开 .Rproj 文件作为整个任务的初始化,那将是最好的。 它可确保您的工作目录顺利有效地工作。 它还可以帮助您避免与工作流程相关的任何错误。

阅读: 6 个适合初学者的有趣 R 项目创意。

如何构建您的项目目录

除了使用 RStudio 项目之外,这里还有一个关于如何构建项目目录以进行有效管理和处理的简要指南。

数据

首先,您应该有一个 Data 子文件夹,您可以在其中保存所有必须读取到 R 中的文件,以执行所需的可视化或分析。 换句话说,这个文件夹是用来存放所有源文件的。

脚本

在此文件夹中,您应该存储所有 R 脚本和所有扩展名为 .Rmd 和 .R 的文件。 它可以有以下子文件夹:

  • 文件

这是您存储所有带有 .Rmd 和 .R 扩展名的文件(也称为 RMarkdown 文件)的地方

  • 职能

这是您存储您创建的所有自定义函数的地方。 它是可选的。

  • 分析

这是您存储项目的所有原始 R 脚本的地方。 当您在一个项目中使用多个分析文件时,此文件夹会派上用场。

学习世界顶尖大学的数据科学课程获得行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。

输出

在此文件夹中,您应该存储您在项目中创建的所有文件,例如 HTML、绘图和导出。 这个文件夹也有很多优点。 首先,它可以帮助其他人找出你的代码的结果在哪里。 其次,它有助于分离所有源文件和您处理的数据。

另请阅读: R 中的 8 个惊人的初学者数据科学项目

结论

我们希望您喜欢本 RStudio 项目指南。 如果您想了解有关 R、编程语言和 RStudio 的更多信息,那么我们建议您前往 upGrad 博客,在那里您可以找到许多有价值的资源、指南和文章。

另一方面,如果你想获得更全面的学习体验,那么你应该学习数据科学课程。

什么是 RStudio,我们为什么用它来构建项目?

RStudio 是 R 语言的集成开发环境或 IDE。 它是最流行的 R IDE 之一,提供控制台、编辑器、用于调试、绘图和管理工作区的工具。 它受欢迎的主要原因之一是它在市场上有两个版本 - 开源和商业版本,这使得用户可以方便地使用它构建项目而无需支付任何费用。 最重要的是,您甚至可以在不使用浏览器版本下载启动的情况下使用它。

一个项目目录的结构应该是什么?

除了制作项目外,如何构建项目目录以有效处理和提高用户的可读性也很重要。 以下是您必须保存文件的理想结构: 第一个文件夹应该是 Data 文件夹,它将保存您项目的所有源文件。 接下来,脚本文件夹将包含所有 R 脚本以及扩展名为 .Rmd 和 .R 的文件。 此文件夹将进一步具有以下子文件夹。 Files 文件夹将保存所有扩展名为 .Rmd 和 .R 的文件。 这些文件也称为Rmarkdown文件。 Functions 文件夹是可选的。 如果您创建了任何自定义函数,您可以将其文件存储在此文件夹中。 当您在一个项目中使用大量分析文件时,Analysis 文件夹会很有用。 您可以将原始 R 脚本存储在此文件夹中。

R语言的应用有哪些?

R 是一种流行的语言,广泛用于多个领域。 如果你有统计背景,对你来说它甚至比 Python 容易得多。 下面列出了 R 语言的一些应用: R 在金融领域非常流行,因为它提供了一个高级统计套件来执行所有金融任务。 就像金融一样,银行系统也使用 R 语言进行风险分析,如信用风险建模。 医疗保健和社交媒体等其他领域也将 R 用于多种用途。