20 распространенных вопросов и ответов на интервью R на 2022 год
Опубликовано: 2021-01-10За последние несколько лет язык программирования R приобрел значительную популярность в сообществах Data Science и Machine Learning. В основном это связано с тем, что это многоцелевой язык, который можно использовать для статистического анализа, визуализации данных, обработки данных, прогнозного моделирования, анализа прогнозов и многого другого.
Поскольку возможности трудоустройства, связанные с R, быстро растут, а курсы по науке о данных процветают, сегодня мы собираемся сосредоточиться на первой части поиска работы в предметной области — собеседовании по R. Вот список наиболее часто задаваемых вопросов на R-интервью!
- Что такое Р?
R — это язык программирования и среда, специально разработанная для статистических вычислений и графики. Он поставляется с обширным каталогом статистических и графических методов, включая линейную регрессию, классификацию, кластеризацию, анализ временных рядов, статистический вывод и алгоритмы машинного обучения, и это лишь некоторые из них.
- Назовите различные структуры данных в R.
R имеет четыре основные структуры данных:
- Вектор — это последовательность элементов данных, принадлежащих к одному типу. Элементы внутри вектора называются компонентами.
- Список — это объект R, который может содержать элементы разных типов, включая числа, строки, векторы или другой список.
- Матрица — это двумерная структура данных, которая может связывать векторы одинаковой длины. Элементы в матрице должны быть одного типа — числовые, символьные, логические или комплексные.
- Dataframe — это более общая версия матрицы, которая может содержать элементы разных типов данных. Кадр данных сочетает в себе характеристики матриц и списков, таких как прямоугольный список, и его столбцы обычно имеют разные типы данных.
- Назовите различные компоненты грамматики графики?
Различные компоненты грамматики графики:
- Уровень данных
- Фасетный слой
- Слой тем
- Слой эстетики
- Слой геометрии
- Координатный слой
- Как установить пакет в R?
Чтобы установить пакет в R, вы должны написать эту команду:
install.packages("<package_name>")
- Как данные импортируются в R?
Чтобы импортировать данные в R, вы должны использовать графический интерфейс R Commander, введя команду «Rcmdr» в консоли R. Есть три способа импортировать данные в R:
Вы можете либо ввести имя набора данных, либо выбрать набор данных в диалоговом окне по своему усмотрению.
- Вы можете ввести данные напрямую, используя редактор R Commander: Данные->Новый набор данных. Это лучше всего работает для небольших и средних наборов данных.
- Вы можете импортировать данные из буфера обмена, URL-адреса, простого текстового файла (ASCII) или любого статистического пакета.
- Что такое Rmarkdown?
RMarkdown — это инструмент отчетности R. Он позволяет создавать высококачественные отчеты R-кода.
Существует три типа выходного формата Rmarkdown:
- HTML
- СЛОВО
- Что такое «t-тесты()» в R?
В R t-test() используется для определения того, равны ли средние значения двух групп друг другу.
- Какие пакеты R используются для вменения данных?
Пакеты R, наиболее часто используемые для вменения данных:
- Ми
- МЫШЕЙ
- Hразное
- Амелия
- вменить R
- Мисс Форест
- Что такое «матрица путаницы» в R?
В R для оценки точности разработанной модели используется матрица путаницы. Он предлагает перекрестный расчет наблюдаемых и прогнозируемых классов с использованием функции «confusionmatrix()», содержащейся в пакете «caTools».
10. Что такое случайный лес? Как вы можете построить и оценить случайный лес в R?
Random Forest — это ансамблевый классификатор, построенный на основе комбинации многих моделей деревьев решений. Поскольку он объединяет результаты многочисленных моделей дерева решений, результат намного точнее, чем у отдельных моделей.
Чтобы построить модель случайного леса в R, у вас должен быть обучающий набор данных. Затем выполните следующие действия:
Сначала разделите набор данных на обучающий набор и тестовый набор->
- Теперь создайте модель Random Forest на поезде ->
- Наконец, предскажите модель случайного леса на тестовом наборе->
- Что такое ShinyR?
ShinyR — это пакет R, который позволяет легко и безопасно разрабатывать интерактивные веб-приложения непосредственно с помощью R.
С ShinyR вы можете размещать автономные приложения на веб-странице или встраивать их в документы Rmarkdown. Кроме того, вы можете расширить свои блестящие приложения для работы с темами CSS, действиями JavaScript и виджетами HTML.
- Назовите пакеты, используемые для интеллектуального анализа данных в R.
Пакеты R, используемые для интеллектуального анализа данных:

- Rpart и каре
- Таблица данных
- Прогноз
- GGplot
- Арулес
- тм
- Каковы цели логистической регрессии и регрессии Пуассона?
В то время как логистическая регрессия помогает прогнозировать двоичный результат на основе заданного набора непрерывных переменных-предикторов, регрессия Пуассона используется для прогнозирования переменной результата, представляющей «счетчики» из заданного набора непрерывных переменных-предикторов.
- Как пропущенные значения представлены в R?
В R отсутствующие значения представлены функцией NA (недоступно). Однако для невозможных значений используется NaN (не число).
- Какая функция используется для добавления наборов данных в R?
В R функция «rbind» используется для соединения двух фреймов данных или наборов данных. Однако два фрейма/набора данных должны содержать переменные одного и того же типа.
- Как сохранить данные в R?
Хотя существует множество способов сохранить данные в R, самый эффективный способ сделать это:
Данные > Активный набор данных > Экспорт активного набора данных
После этого перед вами появится диалоговое окно. Когда вы нажимаете на это диалоговое окно, вы можете сохранить свои данные, как обычно.
- Какие алгоритмы сортировки есть в R?
R имеет пять типов алгоритмов сортировки:
- Сортировка выбором
- Ведро Сортировка
- Пузырьковая сортировка
- Сортировка слиянием
- Быстрая сортировка
- Что такое модель белого шума?
Модель белого шума (WN) представляет собой модель временного ряда. Это простейший способ изображения стационарного процесса.
Модель WN состоит из:
- Фиксированное постоянное среднее
- Фиксированная постоянная дисперсия
- Нет корреляции во времени
- Назовите функции импорта в R.
Различные функции импорта в R включают в себя:
- читать.csv()->
- read_sas()->
- read_excel()->
- read_sav()->
- Назовите функции, используемые для отладки в R.
Функции, используемые для отладки в R:
- Выслеживать()
- отлаживать()
- браузер()
- след()
- восстанавливаться()
Итак, готово! Вот некоторые из наиболее часто задаваемых вопросов на R-интервью. Надеюсь, это поможет вам сломать лед и постепенно углубляться в язык.
Приятного обучения!
Что такое структуры данных в R?
Структуры данных — это контейнеры, в которых хранятся данные для их эффективного использования. Прежде всего, язык R имеет 4 структуры данных: Вектор — это динамически выделяемая структура данных, которая действует как контейнер и хранит значения с аналогичными типами данных. Значения данных, хранящиеся в векторе, называются компонентами. Список можно рассматривать как объект R, который может хранить значения данных нескольких типов данных, таких как целые числа, строки, символы или другой список. Матрица — это структура данных, похожая на сетку, которая связывает векторы одинаковой длины. Это двумерная структура данных, и все элементы в ней должны иметь один и тот же тип данных. Фрейм данных похож на матрицу, за исключением того, что он более общий. Он может содержать значения с различными типами данных, такими как целые числа, строки и символы. Он показывает сочетание характеристик списка и матрицы.
Что такое случайный лес?
Случайный лес — это групповой классификатор. Как следует из названия, он строит и связывает несколько деревьев решений для повышения точности предсказания модели. Каждое наблюдение предоставляется каждому дереву решений и носит нелинейный характер. Набор обучающих данных необходим для построения случайного леса в R. После того, как вы соберете набор обучающих данных, необходимо выполнить два важных шага, чтобы получить случайный лес: разделить набор данных на набор обучающих данных и тестовый набор данных. Используйте обучающий набор данных, чтобы построить случайный лес, и используйте тестовый набор данных, чтобы предсказать модель случайного леса.
Что такое ShinyR и каково его значение?
ShinyR — это пакет языка R с открытым исходным кодом, который предоставляет мощную веб-инфраструктуру, используемую для разработки интерактивных веб-приложений и проектов. С ShinyR вы можете преобразовать свои анализы в веб-приложения без известных веб-технологий, таких как HTML, CSS или JavaScript. Несмотря на то, что это такой мощный инструмент, его легко изучить и использовать. Приложения, разработанные с помощью ShinyR, можно расширить для эффективного использования с помощью виджетов HTML, тем CSS и действий JavaScript. Кроме того, с ShinyR вы можете размещать автономные приложения на веб-странице или встраивать их в документы Rmarkdown.