20 perguntas e respostas comuns da entrevista R para 2022

Publicados: 2021-01-10

Nos últimos anos, a linguagem de programação R ganhou força significativa nas comunidades de Data Science e Machine Learning. Isso ocorre principalmente porque é uma linguagem multifuncional que pode ser usada para análise estatística, visualização de dados, manipulação de dados, modelagem preditiva, análise de previsão e muito mais.

Como as oportunidades de trabalho em torno do R estão aumentando rapidamente e os cursos de ciência de dados estão prosperando, hoje, vamos nos concentrar na primeira parte de conseguir um emprego no domínio – a entrevista do R. Aqui está uma lista das perguntas mais comuns em entrevistas R!

  1. O que é R?

R é uma linguagem de programação e ambiente projetado especificamente para computação estatística e gráficos. Ele vem com um extenso catálogo de métodos estatísticos e gráficos, incluindo regressão linear, classificação, agrupamento, análise de séries temporais, inferência estatística e algoritmos de ML, para citar alguns.

  1. Nomeie as diferentes estruturas de dados em R.

R tem quatro estruturas de dados primárias:

  • Vetor – É uma sequência de elementos de dados pertencentes ao mesmo tipo. Membros dentro de um Vetor são conhecidos como componentes.
  • Lista – É um objeto R que pode conter elementos de diferentes tipos, incluindo números, strings, vetores ou outra lista.
  • Matrix – É uma estrutura de dados bidimensional que pode ligar vetores de mesmo comprimento. Os elementos dentro de uma Matrix devem ser do mesmo tipo – numérico, ou caractere, ou lógico, ou complexo.
  • Dataframe – É uma versão mais genérica de uma matriz, ou seja, pode conter elementos de diferentes tipos de dados. Um Dataframe combina as características de Matrizes e Listas como uma lista retangular, e suas colunas geralmente possuem diferentes tipos de dados.
  1. Nomeie os vários componentes da gramática dos gráficos?

Os diferentes componentes da gramática dos gráficos são:

  • Camada de dados
  • Camada de faceta
  • Camada de temas
  • Camada de estética
  • Camada de geometria
  • Coordenar camada
  1. Como instalar um pacote no R?

Para instalar um pacote em R, você deve escrever este comando:

install.packages(“<package_name>”)

  1. Como os dados são importados no R?

Para importar dados em R, você deve usar a GUI do R Commander digitando o comando “Rcmdr” no console R. Existem três maneiras de importar dados em R:

Você pode inserir o nome do conjunto de dados ou escolher o conjunto de dados na caixa de diálogo conforme achar adequado.

  • Você pode inserir os dados diretamente usando o editor do R Commander: Data->New Data Set. Isso funciona melhor para conjuntos de dados de pequeno e médio porte.
  • Você pode importar dados da área de transferência, um URL, um arquivo de texto simples (ASCII) ou qualquer pacote estatístico.
  1. O que é Rmarkdown?

RMarkdown é a ferramenta de relatórios do R. Ele permite que você crie relatórios de alta qualidade de código R.

Existem três tipos de formato de saída do Rmarkdown:

  • HTML
  • PALAVRA
  • PDF
  1. O que é “t-tests()” em R?

Em R, o t-test() é usado para determinar se as médias de dois grupos são iguais ou não.

  1. Quais são os pacotes R usados ​​para imputação de dados?

Os pacotes R mais usados ​​para imputação de dados são:

  • Mi
  • CAMUNDONGOS
  • Hmisc
  • Amélia
  • imputR
  • missForest
  1. O que é uma “matriz de confusão” em R?

Em R, uma matriz de confusão é usada para avaliar a precisão de um modelo desenvolvido. Ele oferece um cálculo de tabulação cruzada de classes observadas e previstas usando a função “confusionmatrix()” contida no pacote “caTools”.

10. O que é uma Floresta Aleatória? Como você pode construir e avaliar uma Random Forest em R?

Random Forest é um classificador ensemble construído a partir de uma combinação de muitos modelos de árvore de decisão. Uma vez que combina os resultados de vários modelos de árvore de decisão, o resultado é muito mais preciso do que os de modelos individuais.

Para construir um modelo Random Forest em R, você deve ter um conjunto de dados de treinamento. Então prossiga fazendo o seguinte:

Primeiro, separe o conjunto de dados no conjunto de treinamento e no conjunto de teste->

  • Agora, construa o modelo Random Forest no trem->
  • Finalmente, preveja o modelo Random Forest no conjunto de teste->
  1. O que é ShinyR?

ShinyR é um pacote R que permite o desenvolvimento fácil e seguro de aplicativos da Web interativos diretamente usando R.

Com o ShinyR, você pode hospedar aplicativos independentes em uma página da Web ou incorporá-los em documentos Rmarkdown. Além disso, você pode estender seus aplicativos brilhantes para trabalhar com temas CSS, ações JavaScript e widgets HTML.

  1. Nomeie os pacotes usados ​​para mineração de dados em R.

Os pacotes R usados ​​para mineração de dados são:

  • Rparte e acento circunflexo
  • Tabela de dados
  • Previsão
  • GGplot
  • Regras
  • tm
  1. Quais são os propósitos da Regressão Logística e da Regressão de Poisson?

Enquanto a regressão logística ajuda a prever o resultado binário a partir de um determinado conjunto de variáveis ​​de previsão contínuas, a regressão de Poisson é usada para prever a variável de resultado que representa "contagens" de um determinado conjunto de variáveis ​​de previsão contínuas.

  1. Como os valores ausentes são representados em R?

Em R, os valores omissos são representados pela função NA (Não Disponível). No entanto, para valores impossíveis, NaN (não um número) é usado.

  1. Qual função é usada para adicionar conjuntos de dados em R?

Em R, a função “rbind” é usada para unir dois dataframes ou conjuntos de dados. No entanto, os dois dataframes/conjuntos de dados devem conter variáveis ​​do mesmo tipo.

  1. Como você salva dados em R?

Embora existam muitas maneiras de salvar dados em R, a maneira mais eficiente de fazer isso é:

Dados > Conjunto de dados ativo > Exportar conjunto de dados ativo

Depois disso, você verá uma caixa de diálogo aparecer diante de você. Ao clicar nessa caixa de diálogo, você pode salvar seus dados como faria normalmente.

  1. Quais são os algoritmos de ordenação em R?

R tem cinco tipos de algoritmos de ordenação:

  • Ordenação de Seleção
  • Classificação do intervalo
  • Tipo de bolha
  • Mesclar classificação
  • Ordenação rápida
  1. O que é um modelo de ruído branco?

Um modelo de ruído branco (WN) é um modelo de série temporal. É a maneira mais simples de representar um processo estacionário.

Um modelo WN é composto por:

  • Uma média constante fixa
  • Uma variação constante fixa
  • Sem correlação ao longo do tempo
  1. Nomeie as funções de importação em R.

As diferentes funções de importação em R incluem:

  • leia.csv()->
  • read_sas()->
  • read_excel()->
  • read_sav()->
  1. Nomeie as funções usadas para depuração em R.

As funções usadas para depuração em R são:

  • traceback()
  • depurar()
  • navegador()
  • vestígio()
  • recuperar()

Então, lá vai! Estas são algumas das perguntas mais comuns da entrevista R. Espero que isso ajude você a quebrar o gelo e aprofundar o idioma à medida que avança.

Feliz aprendizado!

O que são estruturas de dados em R?

As estruturas de dados são os contêineres que armazenam os dados para usá-los com eficiência. Principalmente, a linguagem R possui 4 estruturas de dados: Vector é uma estrutura de dados alocada dinamicamente que atua como um contêiner e armazena os valores com tipos de dados semelhantes. Os valores de dados armazenados em um vetor são conhecidos como componentes. Uma lista pode ser considerada como um objeto R que pode armazenar valores de dados de vários tipos de dados, como inteiros, strings, caracteres ou outra lista. A Matrix é uma estrutura de dados semelhante a uma grade que liga vetores do mesmo comprimento. É uma estrutura de dados 2-D e todos os elementos dentro dela devem ser do mesmo tipo de dados. Um quadro de dados é semelhante a uma matriz, exceto que é mais genérico. Ele pode conter valores com diferentes tipos de dados, como inteiros, strings e caracteres. Mostra a combinação das características de uma lista e de uma matriz.

O que é floresta aleatória?

Random Forest é um classificador de conjunto. Como o nome sugere, ele constrói e vincula várias árvores de decisão para melhorar a precisão da previsão do modelo. Cada observação é fornecida a cada árvore de decisão e é de natureza não linear. Um conjunto de dados de treinamento é necessário para criar uma floresta aleatória em R. Depois de reunir o conjunto de dados de treinamento, há duas etapas importantes que devem ser seguidas para alcançar a floresta aleatória: Divida o conjunto de dados em conjunto de dados de treinamento e conjunto de dados de teste. Use o conjunto de dados de treinamento para construir a floresta aleatória e use o conjunto de dados de teste para prever o modelo de floresta aleatória.

O que é ShinyR e qual é o seu significado?

ShinyR é um pacote de código aberto da linguagem R que fornece uma poderosa estrutura da Web que é usada para desenvolver aplicativos e projetos da Web interativos. Com o ShinyR, você pode converter suas análises em aplicativos da Web sem tecnologias da Web proeminentes, como HTML, CSS ou JavaScript. Apesar de ser uma ferramenta tão poderosa, é fácil de aprender e implicar. Os aplicativos desenvolvidos com ShinyR podem ser estendidos para serem usados ​​de forma eficiente com widgets HTML, temas CSS e ações JavaScript. Além disso, com o ShinyR, você pode hospedar aplicativos independentes em uma página da Web ou incorporá-los em documentos Rmarkdown.