20 wspólnych pytań i odpowiedzi na wywiad R na rok 2022

Opublikowany: 2021-01-10

W ciągu ostatnich kilku lat język programowania R zyskał znaczną popularność w społecznościach Data Science i Machine Learning. Dzieje się tak głównie dlatego, że jest to wielozadaniowy język, którego można używać do analizy statystycznej, wizualizacji danych, manipulacji danymi, modelowania predykcyjnego, analizy prognoz i wielu innych.

Ponieważ możliwości pracy związane z R szybko rosną, a kursy nauki o danych kwitną, dzisiaj skupimy się na pierwszej części znalezienia pracy w tej domenie – rozmowie kwalifikacyjnej. Oto lista najczęściej zadawanych pytań w wywiadach R!

  1. Co to jest R?

R to język programowania i środowisko zaprojektowane specjalnie do obliczeń statystycznych i grafiki. Zawiera obszerny katalog metod statystycznych i graficznych, w tym regresję liniową, klasyfikację, grupowanie, analizę szeregów czasowych, wnioskowanie statystyczne i algorytmy ML, żeby wymienić tylko kilka.

  1. Nazwij różne struktury danych w R.

R ma cztery podstawowe struktury danych:

  • Wektor — jest to sekwencja elementów danych należących do tego samego typu. Elementy w wektorze nazywane są komponentami.
  • Lista — jest to obiekt R, który może zawierać elementy różnych typów, w tym liczby, ciągi, wektory lub inną listę.
  • Matrix – Jest to dwuwymiarowa struktura danych, która może wiązać wektory o tej samej długości. Elementy w Matrix muszą być tego samego typu — numeryczne, znakowe, logiczne lub złożone.
  • Dataframe – Jest to bardziej ogólna wersja macierzy, to znaczy może zawierać elementy różnych typów danych. Dataframe łączy w sobie cechy macierzy i list jak lista prostokątna, a jej kolumny mają zwykle różne typy danych.
  1. Wymień poszczególne elementy gramatyki grafiki?

Różne składniki gramatyki grafiki to:

  • Warstwa danych
  • Warstwa fasetowa
  • Warstwa motywów
  • Warstwa estetyczna
  • Warstwa geometrii
  • Warstwa współrzędnych
  1. Jak zainstalować pakiet w R?

Aby zainstalować pakiet w R, musisz napisać to polecenie:

install.packages(„<nazwa_pakietu>”)

  1. Jak dane są importowane w R?

Aby zaimportować dane w R, musisz użyć GUI R Commander, wpisując polecenie „Rcmdr” w konsoli R. Istnieją trzy sposoby importowania danych w R:

Możesz wprowadzić nazwę zestawu danych lub wybrać zestaw danych w oknie dialogowym według własnego uznania.

  • Dane można wprowadzić bezpośrednio za pomocą edytora R Commander: Dane->Nowy zbiór danych. Działa to najlepiej w przypadku małych i średnich zestawów danych.
  • Możesz importować dane ze schowka, adresu URL, zwykłego pliku tekstowego (ASCII) lub dowolnego pakietu statystycznego.
  1. Czym jest Rmarkdown?

RMarkdown to narzędzie raportowania R. Pozwala tworzyć wysokiej jakości raporty kodu R.

Istnieją trzy typy formatu wyjściowego Rmarkdown:

  • HTML
  • SŁOWO
  • PDF
  1. Co to jest „t-testy()” w R?

W R, t-test() służy do określenia, czy średnie dwóch grup są sobie równe.

  1. Jakie pakiety R są używane do imputacji danych?

Pakiety R najczęściej używane do imputacji danych to:

  • Mi
  • MYSZY
  • Hmisc
  • Amelia
  • imputowaćR
  • MissLas
  1. Czym jest „macierz pomyłek” w R?

W R do oceny dokładności opracowanego modelu używana jest macierz pomyłek. Oferuje krzyżowe obliczanie obserwowanych i przewidywanych klas za pomocą funkcji „confusionmatrix()” zawartej w pakiecie „caTools”.

10. Co to jest losowy las? Jak zbudować i ocenić losowy las w R?

Random Forest to klasyfikator zbiorowy zbudowany z połączenia wielu modeli drzew decyzyjnych. Ponieważ łączy wyniki wielu modeli drzew decyzyjnych, wynik jest znacznie dokładniejszy niż w przypadku pojedynczych modeli.

Aby zbudować model lasu losowego w języku R, musisz mieć treningowy zestaw danych. Następnie wykonaj następujące czynności:

Najpierw segreguj zbiór danych do zbioru uczącego i zbioru testowego->

  • Teraz zbuduj model Losowego Lasu na zestawie pociągu->
  • Na koniec przewidziano model Losowego Lasu na zbiorze testowym ->
  1. Co to jest ShinyR?

ShinyR to pakiet R, który pozwala na łatwe i bezpieczne tworzenie interaktywnych aplikacji internetowych bezpośrednio przy użyciu języka R.

Dzięki ShinyR możesz hostować samodzielne aplikacje na stronie internetowej lub możesz je również osadzić w dokumentach Rmarkdown. Możesz także rozszerzyć swoje błyszczące aplikacje, aby działały z motywami CSS, działaniami JavaScript i widżetami HTML.

  1. Nazwij pakiety używane do eksploracji danych w R.

Pakiety R używane do eksploracji danych to:

  • Rpart i karetka
  • Tabela danych
  • Prognoza
  • GGplot
  • Arule
  • tm
  1. Jakie są cele regresji logistycznej i regresji Poissona?

Podczas gdy regresja logistyczna pomaga przewidzieć binarny wynik z danego zestawu predyktorów ciągłych, regresja Poissona służy do przewidywania zmiennej wynikowej reprezentującej „liczby” z danego zestawu predyktorów ciągłych.

  1. W jaki sposób brakujące wartości są reprezentowane w R?

W R brakujące wartości są reprezentowane przez funkcję NA (niedostępne). Jednak w przypadku wartości niemożliwych używany jest NaN (nie liczba).

  1. Która funkcja służy do dodawania zestawów danych w R?

W R funkcja „rbind” służy do łączenia dwóch ramek danych lub zestawów danych. Jednak dwie ramki danych/zestawy danych muszą zawierać zmienne tego samego typu.

  1. Jak zapisujesz dane w R?

Chociaż istnieje wiele sposobów zapisywania danych w języku R, najskuteczniejszym sposobem na to jest:

Dane > Aktywny zbiór danych > Eksportuj aktywny zbiór danych

Następnie zobaczysz okno dialogowe, które pojawi się przed tobą. Po kliknięciu tego okna dialogowego możesz zapisać swoje dane tak, jak zwykle.

  1. Jakie są algorytmy sortowania w R?

R ma pięć typów algorytmów sortowania:

  • Wybór Sortuj
  • Sortuj wiadro
  • Sortowanie bąbelkowe
  • Połącz Sortuj
  • Szybkie sortowanie
  1. Co to jest model białego szumu?

Model białego szumu (WN) to model szeregów czasowych. Jest to najprostszy sposób zobrazowania procesu stacjonarnego.

Model WN składa się z:

  • Stała stała średnia
  • Stała stała wariancja
  • Brak korelacji w czasie
  1. Nazwij funkcje importu w R.

Różne funkcje importu w R obejmują:

  • read.csv()->
  • read_sas()->
  • read_excel()->
  • read_sav()->
  1. Nazwij funkcje używane do debugowania w R.

Funkcje używane do debugowania w R to:

  • śledzenie ()
  • odpluskwić()
  • przeglądarka()
  • namierzać()
  • zdrowieć()

Więc proszę! Oto niektóre z najczęściej zadawanych pytań podczas rozmowy kwalifikacyjnej. Mam nadzieję, że pomoże ci to przełamać lody i stale zagłębiać się w język.

Miłej nauki!

Jakie są struktury danych w R?

Struktury danych to kontenery, które przechowują dane, aby efektywnie z nich korzystać. Przede wszystkim język R ma 4 struktury danych: Vector to dynamicznie alokowana struktura danych, która działa jako kontener i przechowuje wartości z podobnymi typami danych. Wartości danych przechowywane w wektorze nazywane są komponentami. Listę można uznać za obiekt języka R, który może przechowywać wartości danych wielu typów danych, takich jak liczby całkowite, ciągi, znaki lub inna lista. Matrix jest strukturą danych podobną do siatki, która wiąże wektory o tej samej długości. Jest to dwuwymiarowa struktura danych, a wszystkie zawarte w niej elementy muszą być tego samego typu danych. Ramka danych jest podobna do macierzy, z tym wyjątkiem, że jest bardziej ogólna. Może przechowywać wartości z różnymi typami danych, takimi jak liczby całkowite, ciągi i znaki. Pokazuje kombinację cech listy i macierzy.

Co to jest losowy las?

Random Forest to klasyfikator zbiorowy. Jak sama nazwa wskazuje, konstruuje i wiąże wiele drzew decyzyjnych, aby poprawić dokładność predykcji modelu. Każda obserwacja jest przekazywana do każdego drzewa decyzyjnego i ma charakter nieliniowy. Uczący zestaw danych jest niezbędny do zbudowania losowego lasu w języku R. Po zebraniu uczącego zestawu danych należy wykonać dwa ważne kroki, aby uzyskać losowy las: Podziel zestaw danych na uczący i testowy zestaw danych. Użyj zestawu danych uczących do skonstruowania losowego lasu i użyj testowego zestawu danych do przewidzenia modelu lasu losowego.

Czym jest ShinyR i jakie jest jego znaczenie?

ShinyR to pakiet open source języka R, który zapewnia potężną platformę internetową służącą do tworzenia interaktywnych aplikacji i projektów internetowych. Dzięki ShinyR możesz przekonwertować swoje analizy na aplikacje internetowe bez znanych technologii internetowych, takich jak HTML, CSS lub JavaScript. Pomimo tego, że jest tak potężnym narzędziem, łatwo się go nauczyć i sugerować. Aplikacje opracowane z ShinyR można rozszerzyć, aby były efektywnie używane z widżetami HTML, motywami CSS i działaniami JavaScript. Ponadto dzięki ShinyR możesz hostować samodzielne aplikacje na stronie internetowej lub możesz je również osadzić w dokumentach Rmarkdown.