20 Pertanyaan & Jawaban Wawancara R Umum untuk 2022
Diterbitkan: 2021-01-10Selama beberapa tahun terakhir, bahasa pemrograman R telah mendapatkan daya tarik yang signifikan dalam komunitas Ilmu Data dan Pembelajaran Mesin. Ini terutama karena ini adalah bahasa multiguna yang dapat digunakan untuk analisis statistik, visualisasi data, manipulasi data, pemodelan prediktif, analisis prakiraan, dan banyak lagi.
Karena peluang kerja seputar R meningkat pesat & kursus ilmu data berkembang pesat, hari ini, kita akan fokus pada bagian pertama dari mendapatkan pekerjaan sebagai domain – wawancara R. Berikut adalah daftar pertanyaan yang paling sering diajukan dalam wawancara R!
- Apa itu R?
R adalah bahasa pemrograman dan lingkungan yang dirancang khusus untuk komputasi statistik dan grafik. Muncul dengan katalog ekstensif metode statistik dan grafis termasuk regresi linier, klasifikasi, pengelompokan, analisis deret waktu, inferensi statistik, dan algoritma ML, untuk beberapa nama.
- Sebutkan struktur data yang berbeda dalam R.
R memiliki empat struktur data utama:
- Vektor – Ini adalah urutan elemen data yang termasuk dalam tipe yang sama. Anggota dalam Vektor dikenal sebagai komponen.
- Daftar – Ini adalah objek R yang dapat berisi elemen dari berbagai jenis, termasuk angka, string, vektor, atau daftar lainnya.
- Matriks – Ini adalah struktur data dua dimensi yang dapat mengikat vektor dengan panjang yang sama. Elemen-elemen dalam Matriks harus bertipe sama – numerik, atau karakter, atau logis, atau kompleks.
- Dataframe – Ini adalah versi matriks yang lebih umum, yaitu dapat berisi elemen dari tipe data yang berbeda. Kerangka Data menggabungkan karakteristik Matriks dan Daftar seperti daftar persegi panjang, dan kolomnya biasanya memiliki tipe data yang berbeda.
- Sebutkan berbagai komponen tata bahasa grafika?
Komponen yang berbeda dari tata bahasa grafis adalah:
- lapisan data
- Lapisan segi
- Lapisan tema
- Lapisan estetika
- Lapisan geometri
- Lapisan koordinat
- Bagaimana cara menginstal paket di R?
Untuk menginstal paket di R, Anda harus menulis perintah ini:
install.packages(“<nama_paket>”)
- Bagaimana data diimpor dalam R?
Untuk mengimpor data di R, Anda harus menggunakan GUI R commander dengan mengetikkan perintah “Rcmdr” ke konsol R. Ada tiga cara untuk mengimpor data di R:
Anda dapat memasukkan nama kumpulan data atau memilih kumpulan data di kotak dialog yang Anda anggap cocok.
- Anda dapat memasukkan data secara langsung menggunakan editor R Commander: Data->New Data Set. Ini berfungsi paling baik untuk kumpulan data berukuran kecil hingga menengah.
- Anda dapat mengimpor data dari clipboard, atau URL, atau file teks biasa (ASCII), atau paket statistik apa pun.
- Apa itu Rmarkdown?
RMarkdown adalah alat pelaporan R. Ini memungkinkan Anda membuat laporan kode R berkualitas tinggi.
Ada tiga jenis format output Rmarkdown:
- HTML
- KATA
- Apa itu "t-test()" di R?
Dalam R, uji-t() digunakan untuk menentukan apakah rata-rata dua kelompok sama satu sama lain atau tidak.
- Apa paket R yang digunakan untuk imputasi data?
Paket R yang paling umum digunakan untuk imputasi data adalah:
- mi
- tikus
- Hmisc
- amelia
- menghitungR
- rinduHutan
- Apa yang dimaksud dengan "matriks kebingungan" di R?
Dalam R, matriks konfusi digunakan untuk menilai keakuratan model yang dikembangkan. Ia menawarkan perhitungan tabulasi silang dari kelas yang diamati dan diprediksi dengan menggunakan fungsi "confusionmatrix()" yang terdapat dalam paket "caTools".
10. Apa itu Hutan Acak? Bagaimana Anda bisa membangun dan mengevaluasi Hutan Acak di R?
Random Forest adalah ensemble classifier yang dibangun dari kombinasi banyak model pohon keputusan. Karena menggabungkan hasil dari banyak model pohon keputusan, hasilnya jauh lebih akurat daripada model individu.
Untuk membangun model Hutan Acak di R, Anda harus memiliki kumpulan data pelatihan. Kemudian lanjutkan dengan melakukan hal berikut:
Pertama, pisahkan dataset ke dalam set pelatihan dan set pengujian->
- Sekarang, buat model Hutan Acak di set kereta->
- Terakhir, prediksi model Hutan Acak pada set pengujian->
- Apa itu ShinyR?
ShinyR adalah paket R yang memungkinkan pengembangan aplikasi web interaktif dengan mudah dan aman secara langsung menggunakan R.
Dengan ShinyR, Anda dapat meng-host aplikasi mandiri di halaman web, atau Anda juga dapat menyematkannya di dokumen Rmarkdown. Selain itu, Anda dapat memperluas aplikasi mengkilap agar berfungsi dengan tema CSS, tindakan JavaScript, dan widget HTML.

- Sebutkan paket-paket yang digunakan untuk data mining di R.
Paket R yang digunakan untuk data mining adalah:
- Rpart dan tanda sisipan
- Tabel data
- Ramalan
- GGplot
- aturan
- tm
- Apa tujuan dari Regresi Logistik dan Regresi Poisson?
Sementara Regresi Logistik membantu untuk memprediksi hasil biner dari set variabel prediktor kontinu yang diberikan, Regresi Poisson digunakan untuk memprediksi variabel hasil yang mewakili "jumlah" dari set variabel prediktor kontinu yang diberikan.
- Bagaimana nilai yang hilang direpresentasikan dalam R?
Dalam R, nilai yang hilang diwakili oleh fungsi NA (Tidak Tersedia). Namun, untuk nilai yang tidak mungkin, NaN (bukan angka) digunakan.
- Fungsi mana yang digunakan untuk menambahkan kumpulan data di R?
Di R, fungsi "rbind" digunakan untuk menggabungkan dua kerangka data atau kumpulan data. Namun, kedua kerangka data/set data harus berisi variabel dengan tipe yang sama.
- Bagaimana Anda menyimpan data di R?
Meskipun ada banyak cara untuk menyimpan data di R, cara yang paling efisien untuk melakukannya adalah:
Data > Kumpulan Data Aktif > Ekspor Kumpulan Data Aktif
Setelah ini, Anda akan melihat kotak dialog muncul di hadapan Anda. Ketika Anda mengklik kotak dialog itu, Anda dapat menyimpan data Anda seperti biasanya.
- Apa algoritma pengurutan di R?
R memiliki lima jenis algoritma pengurutan:
- Sortir Seleksi
- Sortir Bucket
- Sortir Gelembung
- Gabungkan Sortir
- Sortir Cepat
- Apa itu model White Noise?
Model White Noise (WN) adalah model deret waktu. Ini adalah cara paling sederhana untuk menggambarkan proses stasioner.
Sebuah model WN terdiri dari:
- Rata-rata konstanta tetap
- Varian konstan tetap
- Tidak ada korelasi dari waktu ke waktu
- Sebutkan fungsi import pada R.
Fungsi impor yang berbeda dalam R meliputi:
- read.csv()->
- read_sas()->
- read_excel()->
- read_sav()->
- Sebutkan fungsi-fungsi yang digunakan untuk debugging di R.
Fungsi yang digunakan untuk debugging di R adalah:
- melacak kembali()
- debug()
- peramban()
- jejak()
- pulih()
Jadi, ini dia! Ini adalah beberapa pertanyaan wawancara R yang paling sering ditanyakan. Semoga ini akan membantu Anda memecahkan kebekuan dan terus menggali ke dalam bahasa yang Anda gunakan.
Selamat belajar!
Apa struktur data di R?
Struktur data adalah wadah yang menyimpan data untuk digunakan secara efisien. Terutama, bahasa R memiliki 4 struktur data: Vektor adalah struktur data yang dialokasikan secara dinamis yang bertindak sebagai wadah dan menyimpan nilai dengan tipe data yang serupa. Nilai data yang disimpan dalam vektor dikenal sebagai komponen. Daftar dapat dianggap sebagai objek R yang dapat menyimpan nilai data dari beberapa tipe data seperti bilangan bulat, string, karakter, atau daftar lainnya. Matriks adalah struktur data seperti kisi yang mengikat vektor dengan panjang yang sama. Ini adalah struktur data 2-D dan semua elemen di dalamnya harus memiliki tipe data yang sama. Bingkai data mirip dengan matriks kecuali lebih umum. Itu dapat menyimpan nilai dengan tipe data yang berbeda seperti bilangan bulat, string, dan karakter. Ini menunjukkan kombinasi karakteristik daftar dan matriks.
Apa itu hutan acak?
Random Forest adalah pengklasifikasi ansambel. Seperti namanya, itu membangun dan mengikat beberapa pohon keputusan untuk meningkatkan akurasi prediksi model. Setiap pengamatan disediakan untuk setiap pohon keputusan dan sifatnya non-linier. Kumpulan data pelatihan diperlukan untuk membangun hutan acak di R. Setelah Anda mengumpulkan kumpulan data pelatihan, ada dua langkah penting yang harus diikuti untuk mencapai hutan acak: Bagilah kumpulan data ke dalam kumpulan data pelatihan dan kumpulan data uji. Gunakan set data pelatihan untuk membangun hutan acak dan gunakan set data uji untuk memprediksi model hutan acak.
Apa itu ShinyR dan apa artinya?
ShinyR adalah paket open-source bahasa R yang menyediakan kerangka kerja web yang kuat yang digunakan untuk mengembangkan aplikasi dan proyek web interaktif. Dengan ShinyR, Anda dapat mengubah analisis Anda menjadi aplikasi web tanpa teknologi web terkemuka seperti HTML, CSS, atau JavaScript. Meskipun merupakan alat yang sangat kuat, mudah dipelajari dan diimplikasikan. Aplikasi yang dikembangkan dengan ShinyR dapat diperluas untuk digunakan secara efisien dengan widget HTML, tema CSS, dan tindakan JavaScript. Selain itu, dengan ShinyR, Anda dapat meng-host aplikasi mandiri di halaman web, atau Anda juga dapat menyematkannya dalam dokumen Rmarkdown.