20 распространенных вопросов и ответов на интервью R на 2022 год

Опубликовано: 2021-01-10

За последние несколько лет язык программирования R приобрел значительную популярность в сообществах Data Science и Machine Learning. В основном это связано с тем, что это многоцелевой язык, который можно использовать для статистического анализа, визуализации данных, обработки данных, прогнозного моделирования, анализа прогнозов и многого другого.

Поскольку возможности трудоустройства, связанные с R, быстро растут, а курсы по науке о данных процветают, сегодня мы собираемся сосредоточиться на первой части поиска работы в предметной области — собеседовании по R. Вот список наиболее часто задаваемых вопросов на R-интервью!

  1. Что такое Р?

R — это язык программирования и среда, специально разработанная для статистических вычислений и графики. Он поставляется с обширным каталогом статистических и графических методов, включая линейную регрессию, классификацию, кластеризацию, анализ временных рядов, статистический вывод и алгоритмы машинного обучения, и это лишь некоторые из них.

  1. Назовите различные структуры данных в R.

R имеет четыре основные структуры данных:

  • Вектор — это последовательность элементов данных, принадлежащих к одному типу. Элементы внутри вектора называются компонентами.
  • Список — это объект R, который может содержать элементы разных типов, включая числа, строки, векторы или другой список.
  • Матрица — это двумерная структура данных, которая может связывать векторы одинаковой длины. Элементы в матрице должны быть одного типа — числовые, символьные, логические или комплексные.
  • Dataframe — это более общая версия матрицы, которая может содержать элементы разных типов данных. Кадр данных сочетает в себе характеристики матриц и списков, таких как прямоугольный список, и его столбцы обычно имеют разные типы данных.
  1. Назовите различные компоненты грамматики графики?

Различные компоненты грамматики графики:

  • Уровень данных
  • Фасетный слой
  • Слой тем
  • Слой эстетики
  • Слой геометрии
  • Координатный слой
  1. Как установить пакет в R?

Чтобы установить пакет в R, вы должны написать эту команду:

install.packages("<package_name>")

  1. Как данные импортируются в R?

Чтобы импортировать данные в R, вы должны использовать графический интерфейс R Commander, введя команду «Rcmdr» в консоли R. Есть три способа импортировать данные в R:

Вы можете либо ввести имя набора данных, либо выбрать набор данных в диалоговом окне по своему усмотрению.

  • Вы можете ввести данные напрямую, используя редактор R Commander: Данные->Новый набор данных. Это лучше всего работает для небольших и средних наборов данных.
  • Вы можете импортировать данные из буфера обмена, URL-адреса, простого текстового файла (ASCII) или любого статистического пакета.
  1. Что такое Rmarkdown?

RMarkdown — это инструмент отчетности R. Он позволяет создавать высококачественные отчеты R-кода.

Существует три типа выходного формата Rmarkdown:

  • HTML
  • СЛОВО
  • PDF
  1. Что такое «t-тесты()» в R?

В R t-test() используется для определения того, равны ли средние значения двух групп друг другу.

  1. Какие пакеты R используются для вменения данных?

Пакеты R, наиболее часто используемые для вменения данных:

  • Ми
  • МЫШЕЙ
  • Hразное
  • Амелия
  • вменить R
  • Мисс Форест
  1. Что такое «матрица путаницы» в R?

В R для оценки точности разработанной модели используется матрица путаницы. Он предлагает перекрестный расчет наблюдаемых и прогнозируемых классов с использованием функции «confusionmatrix()», содержащейся в пакете «caTools».

10. Что такое случайный лес? Как вы можете построить и оценить случайный лес в R?

Random Forest — это ансамблевый классификатор, построенный на основе комбинации многих моделей деревьев решений. Поскольку он объединяет результаты многочисленных моделей дерева решений, результат намного точнее, чем у отдельных моделей.

Чтобы построить модель случайного леса в R, у вас должен быть обучающий набор данных. Затем выполните следующие действия:

Сначала разделите набор данных на обучающий набор и тестовый набор->

  • Теперь создайте модель Random Forest на поезде ->
  • Наконец, предскажите модель случайного леса на тестовом наборе->
  1. Что такое ShinyR?

ShinyR — это пакет R, который позволяет легко и безопасно разрабатывать интерактивные веб-приложения непосредственно с помощью R.

С ShinyR вы можете размещать автономные приложения на веб-странице или встраивать их в документы Rmarkdown. Кроме того, вы можете расширить свои блестящие приложения для работы с темами CSS, действиями JavaScript и виджетами HTML.

  1. Назовите пакеты, используемые для интеллектуального анализа данных в R.

Пакеты R, используемые для интеллектуального анализа данных:

  • Rpart и каре
  • Таблица данных
  • Прогноз
  • GGplot
  • Арулес
  • тм
  1. Каковы цели логистической регрессии и регрессии Пуассона?

В то время как логистическая регрессия помогает прогнозировать двоичный результат на основе заданного набора непрерывных переменных-предикторов, регрессия Пуассона используется для прогнозирования переменной результата, представляющей «счетчики» из заданного набора непрерывных переменных-предикторов.

  1. Как пропущенные значения представлены в R?

В R отсутствующие значения представлены функцией NA (недоступно). Однако для невозможных значений используется NaN (не число).

  1. Какая функция используется для добавления наборов данных в R?

В R функция «rbind» используется для соединения двух фреймов данных или наборов данных. Однако два фрейма/набора данных должны содержать переменные одного и того же типа.

  1. Как сохранить данные в R?

Хотя существует множество способов сохранить данные в R, самый эффективный способ сделать это:

Данные > Активный набор данных > Экспорт активного набора данных

После этого перед вами появится диалоговое окно. Когда вы нажимаете на это диалоговое окно, вы можете сохранить свои данные, как обычно.

  1. Какие алгоритмы сортировки есть в R?

R имеет пять типов алгоритмов сортировки:

  • Сортировка выбором
  • Ведро Сортировка
  • Пузырьковая сортировка
  • Сортировка слиянием
  • Быстрая сортировка
  1. Что такое модель белого шума?

Модель белого шума (WN) представляет собой модель временного ряда. Это простейший способ изображения стационарного процесса.

Модель WN состоит из:

  • Фиксированное постоянное среднее
  • Фиксированная постоянная дисперсия
  • Нет корреляции во времени
  1. Назовите функции импорта в R.

Различные функции импорта в R включают в себя:

  • читать.csv()->
  • read_sas()->
  • read_excel()->
  • read_sav()->
  1. Назовите функции, используемые для отладки в R.

Функции, используемые для отладки в R:

  • Выслеживать()
  • отлаживать()
  • браузер()
  • след()
  • восстанавливаться()

Итак, готово! Вот некоторые из наиболее часто задаваемых вопросов на R-интервью. Надеюсь, это поможет вам сломать лед и постепенно углубляться в язык.

Приятного обучения!

Что такое структуры данных в R?

Структуры данных — это контейнеры, в которых хранятся данные для их эффективного использования. Прежде всего, язык R имеет 4 структуры данных: Вектор — это динамически выделяемая структура данных, которая действует как контейнер и хранит значения с аналогичными типами данных. Значения данных, хранящиеся в векторе, называются компонентами. Список можно рассматривать как объект R, который может хранить значения данных нескольких типов данных, таких как целые числа, строки, символы или другой список. Матрица — это структура данных, похожая на сетку, которая связывает векторы одинаковой длины. Это двумерная структура данных, и все элементы в ней должны иметь один и тот же тип данных. Фрейм данных похож на матрицу, за исключением того, что он более общий. Он может содержать значения с различными типами данных, такими как целые числа, строки и символы. Он показывает сочетание характеристик списка и матрицы.

Что такое случайный лес?

Случайный лес — это групповой классификатор. Как следует из названия, он строит и связывает несколько деревьев решений для повышения точности предсказания модели. Каждое наблюдение предоставляется каждому дереву решений и носит нелинейный характер. Набор обучающих данных необходим для построения случайного леса в R. После того, как вы соберете набор обучающих данных, необходимо выполнить два важных шага, чтобы получить случайный лес: разделить набор данных на набор обучающих данных и тестовый набор данных. Используйте обучающий набор данных, чтобы построить случайный лес, и используйте тестовый набор данных, чтобы предсказать модель случайного леса.

Что такое ShinyR и каково его значение?

ShinyR — это пакет языка R с открытым исходным кодом, который предоставляет мощную веб-инфраструктуру, используемую для разработки интерактивных веб-приложений и проектов. С ShinyR вы можете преобразовать свои анализы в веб-приложения без известных веб-технологий, таких как HTML, CSS или JavaScript. Несмотря на то, что это такой мощный инструмент, его легко изучить и использовать. Приложения, разработанные с помощью ShinyR, можно расширить для эффективного использования с помощью виджетов HTML, тем CSS и действий JavaScript. Кроме того, с ShinyR вы можете размещать автономные приложения на веб-странице или встраивать их в документы Rmarkdown.