20 распространенных вопросов и ответов на интервью R на 2022 год

Опубликовано: 2021-01-10

За последние несколько лет язык программирования R приобрел значительную популярность в сообществах Data Science и Machine Learning. В основном это связано с тем, что это многоцелевой язык, который можно использовать для статистического анализа, визуализации данных, обработки данных, прогнозного моделирования, анализа прогнозов и многого другого.

Поскольку возможности трудоустройства, связанные с R, быстро растут, а курсы по науке о данных процветают, сегодня мы собираемся сосредоточиться на первой части поиска работы в предметной области — собеседовании по R. Вот список наиболее часто задаваемых вопросов на R-интервью!

Что такое Р?

R — это язык программирования и среда, специально разработанная для статистических вычислений и графики. Он поставляется с обширным каталогом статистических и графических методов, включая линейную регрессию, классификацию, кластеризацию, анализ временных рядов, статистический вывод и алгоритмы машинного обучения, и это лишь некоторые из них.

Назовите различные структуры данных в R.

R имеет четыре основные структуры данных:

Вектор — это последовательность элементов данных, принадлежащих к одному типу. Элементы внутри вектора называются компонентами.
Список — это объект R, который может содержать элементы разных типов, включая числа, строки, векторы или другой список.
Матрица — это двумерная структура данных, которая может связывать векторы одинаковой длины. Элементы в матрице должны быть одного типа — числовые, символьные, логические или комплексные.
Dataframe — это более общая версия матрицы, которая может содержать элементы разных типов данных. Кадр данных сочетает в себе характеристики матриц и списков, таких как прямоугольный список, и его столбцы обычно имеют разные типы данных.

Назовите различные компоненты грамматики графики?

Различные компоненты грамматики графики:

Уровень данных
Фасетный слой
Слой тем
Слой эстетики
Слой геометрии
Координатный слой

Как установить пакет в R?

Чтобы установить пакет в R, вы должны написать эту команду:

install.packages("<package_name>")

Как данные импортируются в R?

Чтобы импортировать данные в R, вы должны использовать графический интерфейс R Commander, введя команду «Rcmdr» в консоли R. Есть три способа импортировать данные в R:

Вы можете либо ввести имя набора данных, либо выбрать набор данных в диалоговом окне по своему усмотрению.

Вы можете ввести данные напрямую, используя редактор R Commander: Данные->Новый набор данных. Это лучше всего работает для небольших и средних наборов данных.
Вы можете импортировать данные из буфера обмена, URL-адреса, простого текстового файла (ASCII) или любого статистического пакета.

Что такое Rmarkdown?

RMarkdown — это инструмент отчетности R. Он позволяет создавать высококачественные отчеты R-кода.

Существует три типа выходного формата Rmarkdown:

HTML
СЛОВО
PDF

Что такое «t-тесты()» в R?

В R t-test() используется для определения того, равны ли средние значения двух групп друг другу.

Какие пакеты R используются для вменения данных?

Пакеты R, наиболее часто используемые для вменения данных:

Ми
МЫШЕЙ
Hразное
Амелия
вменить R
Мисс Форест

Что такое «матрица путаницы» в R?

В R для оценки точности разработанной модели используется матрица путаницы. Он предлагает перекрестный расчет наблюдаемых и прогнозируемых классов с использованием функции «confusionmatrix()», содержащейся в пакете «caTools».

10. Что такое случайный лес? Как вы можете построить и оценить случайный лес в R?

Random Forest — это ансамблевый классификатор, построенный на основе комбинации многих моделей деревьев решений. Поскольку он объединяет результаты многочисленных моделей дерева решений, результат намного точнее, чем у отдельных моделей.

Чтобы построить модель случайного леса в R, у вас должен быть обучающий набор данных. Затем выполните следующие действия:

Сначала разделите набор данных на обучающий набор и тестовый набор->

Теперь создайте модель Random Forest на поезде ->
Наконец, предскажите модель случайного леса на тестовом наборе->

Что такое ShinyR?

ShinyR — это пакет R, который позволяет легко и безопасно разрабатывать интерактивные веб-приложения непосредственно с помощью R.

С ShinyR вы можете размещать автономные приложения на веб-странице или встраивать их в документы Rmarkdown. Кроме того, вы можете расширить свои блестящие приложения для работы с темами CSS, действиями JavaScript и виджетами HTML.

Назовите пакеты, используемые для интеллектуального анализа данных в R.

Пакеты R, используемые для интеллектуального анализа данных:

Rpart и каре
Таблица данных
Прогноз
GGplot
Арулес
тм

Каковы цели логистической регрессии и регрессии Пуассона?

В то время как логистическая регрессия помогает прогнозировать двоичный результат на основе заданного набора непрерывных переменных-предикторов, регрессия Пуассона используется для прогнозирования переменной результата, представляющей «счетчики» из заданного набора непрерывных переменных-предикторов.

Как пропущенные значения представлены в R?

В R отсутствующие значения представлены функцией NA (недоступно). Однако для невозможных значений используется NaN (не число).

Какая функция используется для добавления наборов данных в R?

В R функция «rbind» используется для соединения двух фреймов данных или наборов данных. Однако два фрейма/набора данных должны содержать переменные одного и того же типа.

Как сохранить данные в R?

Хотя существует множество способов сохранить данные в R, самый эффективный способ сделать это:

Данные > Активный набор данных > Экспорт активного набора данных

После этого перед вами появится диалоговое окно. Когда вы нажимаете на это диалоговое окно, вы можете сохранить свои данные, как обычно.

Какие алгоритмы сортировки есть в R?

R имеет пять типов алгоритмов сортировки:

Сортировка выбором
Ведро Сортировка
Пузырьковая сортировка
Сортировка слиянием
Быстрая сортировка

Что такое модель белого шума?

Модель белого шума (WN) представляет собой модель временного ряда. Это простейший способ изображения стационарного процесса.

Модель WN состоит из:

Фиксированное постоянное среднее
Фиксированная постоянная дисперсия
Нет корреляции во времени

Назовите функции импорта в R.

Различные функции импорта в R включают в себя:

читать.csv()->
read_sas()->
read_excel()->
read_sav()->

Назовите функции, используемые для отладки в R.

Функции, используемые для отладки в R:

Выслеживать()
отлаживать()
браузер()
след()
восстанавливаться()

Итак, готово! Вот некоторые из наиболее часто задаваемых вопросов на R-интервью. Надеюсь, это поможет вам сломать лед и постепенно углубляться в язык.

Приятного обучения!

Что такое структуры данных в R?

Структуры данных — это контейнеры, в которых хранятся данные для их эффективного использования. Прежде всего, язык R имеет 4 структуры данных: Вектор — это динамически выделяемая структура данных, которая действует как контейнер и хранит значения с аналогичными типами данных. Значения данных, хранящиеся в векторе, называются компонентами. Список можно рассматривать как объект R, который может хранить значения данных нескольких типов данных, таких как целые числа, строки, символы или другой список. Матрица — это структура данных, похожая на сетку, которая связывает векторы одинаковой длины. Это двумерная структура данных, и все элементы в ней должны иметь один и тот же тип данных. Фрейм данных похож на матрицу, за исключением того, что он более общий. Он может содержать значения с различными типами данных, такими как целые числа, строки и символы. Он показывает сочетание характеристик списка и матрицы.

Что такое случайный лес?

Случайный лес — это групповой классификатор. Как следует из названия, он строит и связывает несколько деревьев решений для повышения точности предсказания модели. Каждое наблюдение предоставляется каждому дереву решений и носит нелинейный характер. Набор обучающих данных необходим для построения случайного леса в R. После того, как вы соберете набор обучающих данных, необходимо выполнить два важных шага, чтобы получить случайный лес: разделить набор данных на набор обучающих данных и тестовый набор данных. Используйте обучающий набор данных, чтобы построить случайный лес, и используйте тестовый набор данных, чтобы предсказать модель случайного леса.

Что такое ShinyR и каково его значение?

ShinyR — это пакет языка R с открытым исходным кодом, который предоставляет мощную веб-инфраструктуру, используемую для разработки интерактивных веб-приложений и проектов. С ShinyR вы можете преобразовать свои анализы в веб-приложения без известных веб-технологий, таких как HTML, CSS или JavaScript. Несмотря на то, что это такой мощный инструмент, его легко изучить и использовать. Приложения, разработанные с помощью ShinyR, можно расширить для эффективного использования с помощью виджетов HTML, тем CSS и действий JavaScript. Кроме того, с ShinyR вы можете размещать автономные приложения на веб-странице или встраивать их в документы Rmarkdown.