2022 için 20 Ortak R Mülakat Sorusu ve Yanıtı

Yayınlanan: 2021-01-10

Son birkaç yılda, R programlama dili, Veri Bilimi ve Makine Öğrenimi topluluklarında önemli bir çekiş kazandı. Bunun temel nedeni, istatistiksel analiz, veri görselleştirme, veri işleme, tahmine dayalı modelleme, tahmin analizi ve çok daha fazlası için kullanılabilen çok amaçlı bir dil olmasıdır.

R'yi çevreleyen iş fırsatları hızla artarken ve veri bilimi kursları gelişirken, bugün, bir işe girmenin ilk bölümüne, etki alanına - R görüşmesine odaklanacağız. İşte R röportajlarında en sık sorulan soruların listesi!

  1. R nedir?

R, istatistiksel hesaplama ve grafikler için özel olarak tasarlanmış bir programlama dili ve ortamıdır. Doğrusal regresyon, sınıflandırma, kümeleme, zaman serisi analizi, istatistiksel çıkarım ve makine öğrenimi algoritmaları dahil olmak üzere kapsamlı bir istatistiksel ve grafik yöntemler kataloğu ile birlikte gelir.

  1. R'deki farklı veri yapılarını adlandırın.

R'nin dört birincil veri yapısı vardır:

  • Vektör – Aynı türe ait veri öğeleri dizisidir. Bir Vector içindeki üyeler, bileşen olarak bilinir.
  • Liste – Sayılar, dizeler, vektörler veya başka bir liste dahil olmak üzere farklı türde öğeler içerebilen bir R nesnesidir.
  • Matris – Aynı uzunluktaki vektörleri bağlayabilen iki boyutlu bir veri yapısıdır. Bir Matrix içindeki öğeler aynı türde olmalıdır - sayısal veya karakter veya mantıksal veya karmaşık.
  • Dataframe – Bir matrisin daha genel bir versiyonudur, yani farklı veri türlerinin öğelerini içerebilir. Bir Dataframe, Matrislerin ve Listelerin özelliklerini dikdörtgen bir liste gibi birleştirir ve sütunları genellikle farklı veri türlerine sahiptir.
  1. Grafik gramerinin çeşitli bileşenlerini adlandırın?

Grafik gramerinin farklı bileşenleri şunlardır:

  • Veri katmanı
  • Faset katmanı
  • Temalar katmanı
  • estetik katman
  • geometri katmanı
  • koordinat katmanı
  1. R'de bir paket nasıl kurulur?

R'ye bir paket kurmak için şu komutu yazmanız gerekir:

install.packages(“<paket_adı>”)

  1. Veriler R'de nasıl içe aktarılır?

R'deki verileri içe aktarmak için, R konsoluna “Rcmdr” komutunu yazarak R komutanı GUI'sini kullanmanız gerekir. R'de verileri içe aktarmanın üç yolu vardır:

Veri kümesinin adını girebilir veya iletişim kutusunda uygun gördüğünüz şekilde veri kümesini seçebilirsiniz.

  • Verileri doğrudan R Commander düzenleyicisini kullanarak girebilirsiniz: Veri->Yeni Veri Kümesi. Bu, küçük ve orta ölçekli veri kümeleri için en iyi sonucu verir.
  • Panodan veya bir URL'den veya bir düz metin dosyasından (ASCII) veya herhangi bir istatistiksel paketten veri aktarabilirsiniz.
  1. Rmarkdown nedir?

RMarkdown, R'nin raporlama aracıdır. R kodunun yüksek kaliteli raporlarını oluşturmanıza olanak tanır.

Rmarkdown'ın üç tür çıktı formatı vardır:

  • HTML
  • KELİME
  • PDF
  1. R'de “t-testleri ()” nedir?

R'de t-test(), iki grubun ortalamalarının birbirine eşit olup olmadığını belirlemek için kullanılır.

  1. Veri ataması için kullanılan R paketleri nelerdir?

Veri yükleme için en yaygın olarak kullanılan R paketleri şunlardır:

  • Mi
  • fare
  • hmisc
  • Amelia
  • imputeR
  • missForest
  1. R'de "karışıklık matrisi" nedir?

R'de, geliştirilen bir modelin doğruluğunu değerlendirmek için bir karışıklık matrisi kullanılır. "caTools" paketinde bulunan "confusionmatrix()" işlevini kullanarak gözlemlenen ve tahmin edilen sınıfların çapraz tablo hesaplamasını sunar.

10. Rastgele Orman Nedir? R'de bir Rastgele Ormanı nasıl inşa edebilir ve değerlendirebilirsiniz?

Random Forest, birçok karar ağacı modelinin birleşiminden oluşturulmuş bir topluluk sınıflandırıcıdır. Çok sayıda karar ağacı modelinin sonuçlarını birleştirdiği için sonuç, bireysel modellerden çok daha doğrudur.

R'de bir Rastgele Orman modeli oluşturmak için bir eğitim veri kümeniz olmalıdır. Ardından aşağıdakileri yaparak devam edin:

İlk olarak, veri kümesini eğitim kümesine ayırın ve test kümesi->

  • Şimdi, Rastgele Orman modelini tren setine kurun->
  • Son olarak, test setinde Rastgele Orman modelini tahmin edin->
  1. ShinyR nedir?

ShinyR, doğrudan R kullanarak etkileşimli web uygulamalarının kolay ve güvenli bir şekilde geliştirilmesine olanak sağlayan bir R paketidir.

ShinyR ile bir web sayfasında bağımsız uygulamalar barındırabilir veya bunları Rmarkdown belgelerine de gömebilirsiniz. Ayrıca, parlak uygulamalarınızı CSS temaları, JavaScript eylemleri ve HTML pencere öğeleriyle çalışacak şekilde genişletebilirsiniz.

  1. R'de veri madenciliği için kullanılan paketleri adlandırın.

Veri madenciliği için kullanılan R paketleri şunlardır:

  • Rpart ve şapka
  • Veri tablosu
  • Tahmin etmek
  • GGplot
  • Arüller
  • tm
  1. Lojistik Regresyon ve Poisson Regresyonunun amaçları nelerdir?

Lojistik Regresyon, verilen sürekli tahmin değişkenlerinden ikili sonucu tahmin etmeye yardımcı olurken, Poisson Regresyon, verilen sürekli tahmin değişkenlerinden “sayımları” temsil eden sonuç değişkenini tahmin etmek için kullanılır.

  1. R'de eksik değerler nasıl temsil edilir?

R'de, eksik değerler NA (Kullanılamaz) işlevi ile temsil edilir. Ancak imkansız değerler için NaN (sayı değil) kullanılır.

  1. R'de veri kümeleri eklemek için hangi işlev kullanılır?

R'de "rbind" işlevi iki veri çerçevesini veya veri kümesini birleştirmek için kullanılır. Ancak, iki veri çerçevesi/veri kümesi aynı türde değişkenler içermelidir.

  1. Verileri R'ye nasıl kaydedersiniz?

R'de veri kaydetmenin birçok yolu olsa da, bunu yapmanın en etkili yolu şudur:

Veri > Aktif Veri Kümesi > Aktif Veri Kümesini Dışa Aktar

Bundan sonra, önünüzde bir diyalog kutusu belirdiğini göreceksiniz. Bu diyalog kutusuna tıkladığınızda, normalde yaptığınız gibi verilerinizi kaydedebilirsiniz.

  1. R'deki sıralama algoritmaları nelerdir?

R'nin beş tür sıralama algoritması vardır:

  • Seçim Sıralaması
  • Kova Sıralaması
  • Kabarcık Sıralaması
  • Sıralamayı Birleştir
  • Hızlı sıralama
  1. Beyaz Gürültü modeli nedir?

Beyaz Gürültü (WN) modeli bir zaman serisi modelidir. Durağan bir süreci tasvir etmenin en basit yoludur.

Bir WN modeli şunlardan oluşur:

  • Sabit bir sabit ortalama
  • Sabit bir sabit varyans
  • Zaman içinde korelasyon yok
  1. R'de içe aktarma işlevlerini adlandırın.

R'deki farklı içe aktarma işlevleri şunları içerir:

  • read.csv()->
  • read_sas()->
  • read_excel()->
  • read_sav()->
  1. R'de hata ayıklama için kullanılan işlevleri adlandırın.

R'de hata ayıklamak için kullanılan işlevler şunlardır:

  • geri iz()
  • hata ayıklama()
  • tarayıcı()
  • iz()
  • kurtarmak()

Al işte ozaman, buyur! Bunlar, en sık sorulan R mülakat sorularından bazılarıdır. Umarım bu, buzu kırmanıza ve ilerledikçe dili sürekli olarak kazmanıza yardımcı olur.

Mutlu öğrenme!

R'deki veri yapıları nelerdir?

Veri yapıları, verileri verimli kullanmak için depolayan kaplardır. Öncelikle, R dili 4 veri yapısına sahiptir: Vektör, kapsayıcı görevi gören ve benzer veri türlerine sahip değerleri depolayan dinamik olarak tahsis edilmiş bir veri yapısıdır. Bir vektörde depolanan veri değerleri, bileşenler olarak bilinir. Liste, tamsayılar, dizeler, karakterler veya başka bir liste gibi birden çok veri türünün veri değerlerini depolayabilen bir R nesnesi olarak düşünülebilir. Matrix, aynı uzunluktaki vektörleri birbirine bağlayan ızgara benzeri bir veri yapısıdır. 2 boyutlu bir veri yapısıdır ve içindeki tüm öğeler aynı veri türünden olmalıdır. Bir veri çerçevesi, daha genel olması dışında bir matrise benzer. Tamsayılar, dizeler ve karakterler gibi farklı veri türlerine sahip değerleri tutabilir. Bir liste ve bir matrisin özelliklerinin birleşimini gösterir.

Rastgele orman nedir?

Random Forest bir topluluk sınıflandırıcıdır. Adından da anlaşılacağı gibi, modelin tahmin doğruluğunu iyileştirmek için birden fazla karar ağacı oluşturur ve birbirine bağlar. Her gözlem, her karar ağacına verilir ve doğası gereği doğrusal değildir. R'de rastgele bir orman oluşturmak için bir eğitim veri kümesi gereklidir. Eğitim veri kümesini topladığınızda, rastgele ormanı elde etmek için izlenmesi gereken iki önemli adım vardır: Veri kümesini eğitim veri kümesine ve test veri kümesine bölün. Rastgele ormanı oluşturmak için eğitim veri kümesini kullanın ve rastgele orman modelini tahmin etmek için test veri kümesini kullanın.

ShinyR nedir ve önemi nedir?

ShinyR, etkileşimli web uygulamaları ve projeleri geliştirmek için kullanılan güçlü bir web çerçevesi sağlayan açık kaynaklı bir R dili paketidir. ShinyR ile HTML, CSS veya JavaScript gibi önde gelen web teknolojileri olmadan analizlerinizi web uygulamalarına dönüştürebilirsiniz. Bu kadar güçlü bir araç olmasına rağmen, öğrenmesi ve ima etmesi kolaydır. ShinyR ile geliştirilen uygulamalar, HTML widget'ları, CSS temaları ve JavaScript eylemleriyle verimli bir şekilde kullanılmak üzere genişletilebilir. Ayrıca ShinyR ile bir web sayfasında bağımsız uygulamalar barındırabilir veya bunları Rmarkdown belgelerine de gömebilirsiniz.