26 Veri Analisti Mülakat Sorularını ve Cevaplarını Okumalısınız: Nihai Kılavuz 2022

Yayınlanan: 2021-01-07

Bir veri analisti görüşmesine katılmak ve içinden geçeceğiniz tüm soru ve tartışmaların neler olduğunu merak etmek? Bir veri analizi görüşmesine katılmadan önce, onlara zihinsel olarak cevaplar hazırlayabilmeniz için veri analisti görüşme sorularının türü hakkında bir fikre sahip olmak daha iyidir.

Bu yazıda, bazı en önemli veri analisti mülakat sorularına ve cevaplarına bakacağız. Veri Bilimi ve Veri Analitiği, şu anda sektörde gelişen alanlardır. Doğal olarak, bu alanlardaki kariyerler hızla artıyor. Veri bilimi alanında kariyer yapmanın en iyi yanı, aralarından seçim yapabileceğiniz çok çeşitli kariyer seçenekleri sunmasıdır!

Dünyanın dört bir yanındaki kuruluşlar, genel üretkenliklerini ve verimliliklerini artırmak için Büyük Veri'den yararlanıyor; bu, kaçınılmaz olarak, veri analistleri, veri mühendisleri ve veri bilimciler gibi uzman veri uzmanlarına olan talebin de katlanarak arttığı anlamına geliyor. Ancak bu işleri torbalamak için sadece temel niteliklere sahip olmak yeterli değildir. Veri bilimi sertifikalarının yanınızda olması, profilinizin ağırlığını artıracaktır.

Görüşmenin en zor kısmını temizlemeniz gerekiyor. Endişelenmeyin, soruların arkasındaki derinliği ve gerçek amacı anlamak için bu Veri analisti görüşme soruları ve yanıtları kılavuzunu oluşturduk.

İçindekiler

En İyi Veri Analisti Mülakat Soruları ve Cevapları

1. Veri Analisti olmak için temel gereksinimler nelerdir?

Bu veri analisti mülakat sorusu, veri bilimcisi olmak için gerekli beceri seti hakkındaki bilginizi test eder.
Veri analisti olmak için yapmanız gerekenler:

veri analisti mülakat soruları cevapları

  • Programlama dilleri (XML, Javascript veya ETL çerçeveleri), veritabanları (SQL, SQLite, Db2, vb.) konusunda bilgili olun ve ayrıca raporlama paketleri (İş Nesneleri) hakkında kapsamlı bilgiye sahip olun.
  • Büyük Veriyi verimli bir şekilde analiz edebilir, organize edebilir, toplayabilir ve yayabilir.
  • Veritabanı tasarımı, veri madenciliği ve segmentasyon teknikleri gibi alanlarda önemli teknik bilgiye sahip olmalısınız.
  • SAS, Excel ve SPSS gibi büyük veri kümelerini analiz etmek için istatistiksel paketler hakkında sağlam bir bilgiye sahip olun.

2. Bir veri analistinin önemli sorumlulukları nelerdir?

Bu, en sık sorulan veri analisti mülakat sorusudur. İşinizin neleri gerektirdiği konusunda net bir fikriniz olmalıdır.
gerçekleştirmek için bir veri analisti gereklidir.

aşağıdaki görevler:

  • Birden fazla kaynaktan veri toplayın ve yorumlayın ve sonuçları analiz edin.
  • Birden çok kaynaktan toplanan verileri filtreleyin ve "temizleyin".
  • Veri analizinin her yönüne destek sunun.
  • Karmaşık veri kümelerini analiz edin ve içlerindeki gizli kalıpları belirleyin.
  • Veritabanlarını güvende tutun.
Veri Analitiğine Nasıl Geçiş Yapabilirsiniz?

3. “Veri Temizleme” ne anlama geliyor? Bunu uygulamanın en iyi yolları nelerdir?

Bir veri analisti işi için oturuyorsanız, bu en sık sorulan veri analisti mülakat sorularından biridir.
Veri temizleme, öncelikle veri kalitesini iyileştirmek için verilerdeki hataları ve tutarsızlıkları tespit etme ve kaldırma sürecini ifade eder.
Verileri temizlemenin en iyi yolları şunlardır:

  • Verileri ilgili özelliklerine göre ayırma.
  • Büyük veri parçalarını küçük veri kümelerine bölmek ve ardından bunları temizlemek.
  • Her veri sütununun istatistiklerini analiz etme.
  • Genel temizleme görevleriyle başa çıkmak için bir dizi yardımcı işlev veya komut dosyası oluşturma.
  • Gerekirse veri kümelerine kolay ekleme veya çıkarma işlemini kolaylaştırmak için tüm veri temizleme işlemlerinin kaydını tutmak.

4. Veri analizi için kullanılan en iyi araçları adlandırın.

En çok kullanılan araçla ilgili bir soru, çoğunlukla herhangi bir veri analizi görüşme sorusunda bulacağınız bir sorudur.
Veri analizi için en kullanışlı araçlar şunlardır:

  • tablo
  • Google Füzyon Tabloları
  • Google Arama Operatörleri
  • BIÇAK
  • RapidMiner
  • çözücü
  • OpenRefine
  • DüğümXL
  • io

Ödeme: Hindistan'da Veri Analisti Maaşı

5. Veri profili oluşturma ve veri madenciliği arasındaki fark nedir?

Veri Profili Oluşturma, verilerin tek tek niteliklerini analiz etmeye odaklanır, böylece veri türü, sıklığı, uzunluğu gibi veri nitelikleri ile bunların ayrık değerleri ve değer aralıkları hakkında değerli bilgiler sağlar. Aksine, veri madenciliği olağandışı kayıtları tanımlamayı, veri kümelerini analiz etmeyi ve birkaçını saymak gerekirse dizi keşfini amaçlar.

6. KNN atama yöntemi nedir?

KNN atama yöntemi, eksik öznitelik değerlerine en yakın öznitelik değerlerini kullanarak eksik özniteliklerin değerlerini atfetmeyi amaçlar. İki öznitelik değeri arasındaki benzerlik, uzaklık fonksiyonu kullanılarak belirlenir.

7. Bir veri analisti eksik veya şüpheli verilerle ne yapmalıdır?

Böyle bir durumda, bir veri analistinin şunları yapması gerekir:

  • Eksik verileri tespit etmek için silme yöntemi, tekli atama yöntemleri ve model tabanlı yöntemler gibi veri analizi stratejilerini kullanın.
  • Şüpheli veya eksik verilerle ilgili tüm bilgileri içeren bir doğrulama raporu hazırlayın.
  • Geçerliliklerini değerlendirmek için şüpheli verileri inceleyin.
  • Tüm geçersiz verileri (varsa) uygun bir doğrulama koduyla değiştirin.

8. Veri analistleri tarafından kullanılan farklı veri doğrulama yöntemlerini adlandırın.

Veri kümelerini doğrulamanın birçok yolu vardır. Veri Analistleri tarafından en sık kullanılan veri doğrulama yöntemlerinden bazıları şunlardır:

  • Alan Düzeyinde Doğrulama – Bu yöntemde, bir kullanıcı verileri girdiğinde ve her alanda veri doğrulaması yapılır. Gittikçe hataları düzeltmeye yardımcı olur.
  • Form Düzeyinde Doğrulama – Bu yöntemde, kullanıcı formu doldurup gönderdikten sonra veriler doğrulanır. Tüm veri giriş formunu bir kerede kontrol eder, içindeki tüm alanları doğrular ve kullanıcının düzeltebilmesi için hataları (varsa) vurgular.
  • Veri Tasarrufu Doğrulaması – Bu veri doğrulama tekniği, gerçek bir dosya veya veri tabanı kaydı kaydetme işlemi sırasında kullanılır. Genellikle, birden çok veri giriş formunun doğrulanması gerektiğinde yapılır.
  • Arama Kriterlerinin Doğrulanması – Bu doğrulama tekniği, kullanıcıya aranan anahtar kelimeleri veya kelime öbekleri için doğru ve ilgili eşleşmeler sunmak için kullanılır. Bu doğrulama yönteminin temel amacı, kullanıcının arama sorgularının en alakalı sonuçları döndürmesini sağlamaktır.

9. Aykırı Değeri Tanımlayın

Bir veri analisti görüşme soru ve cevap kılavuzu bu soru olmadan tamamlanmayacaktır. Aykırı değer, bir örnekteki bir dizi modelden çok uzak ve farklı görünen bir değere atıfta bulunurken veri analistleri tarafından yaygın olarak kullanılan bir terimdir. İki tür aykırı değer vardır - Tek Değişkenli ve Çok Değişkenli.

Aykırı değerleri tespit etmek için kullanılan iki yöntem şunlardır:

  • Kutu grafiği yöntemi – Bu yönteme göre, değer, üst çeyreğin (Q3) üstünde veya alt çeyreğin (Q1) altında kalacak şekilde 1.5*IQR'den (çeyrekler arası aralık) yüksek veya küçükse, değer bir aykırı değerdir. .
  • Standart sapma yöntemi – Bu yöntem, bir değerin ortalama ± (3*standart sapma) değerinden yüksek veya düşük olması durumunda bunun bir aykırı değer olduğunu belirtir. Keşifsel Veri Analizi ve İşletmeniz İçin Önemi

10. “Kümeleme” nedir? Kümeleme algoritmalarının özelliklerini adlandırın.

Kümeleme, verilerin kümeler ve gruplar halinde sınıflandırıldığı bir yöntemdir. Bir kümeleme algoritması aşağıdaki özelliklere sahiptir:

  • Hiyerarşik veya düz
  • Sert ve yumuşak
  • yinelemeli
  • ayırıcı

11. K-ortalama Algoritması nedir?

K-ortalama, nesnelerin K gruplarına kategorize edildiği bir bölümleme tekniğidir. Bu algoritmada, kümeler küreseldir ve veri noktaları o kümenin etrafında hizalanır ve kümelerin varyansı birbirine benzerdir.

12. “İşbirlikçi Filtreleme”yi tanımlayın.

İşbirliğine dayalı filtreleme, bir kullanıcının davranışsal verilerine dayalı bir öneri sistemi oluşturan bir algoritmadır. Örneğin, çevrimiçi alışveriş siteleri genellikle tarama geçmişinize ve önceki satın alımlarınıza dayanarak "sizin için önerilenler" başlığı altında bir ürün listesi derler. Bu algoritmanın önemli bileşenleri arasında kullanıcılar, nesneler ve ilgi alanları yer alır.

13. Veri analistleri için son derece faydalı olan istatistiksel yöntemleri adlandırın?

Veri analistleri tarafından en çok kullanılan istatistiksel yöntemler şunlardır:

  • Bayes yöntemi
  • Markov süreci
  • Simpleks algoritması
  • Atama
  • Mekansal ve küme süreçleri
  • Sıra istatistikleri, yüzdelik dilim, aykırı değer tespiti
  • matematiksel optimizasyon

14. N-gram nedir?

Bir n-gram, belirli bir metin veya konuşmadaki bağlantılı bir n öğe dizisidir. Tam olarak, bir N-gram (n-1)'de olduğu gibi belirli bir sıradaki bir sonraki öğeyi tahmin etmek için kullanılan olasılıksal bir dil modelidir.

15. Hash tablosu çarpışması nedir? Nasıl önlenebilir?

Bu, önemli veri analisti görüşme sorularından biridir. İki ayrı anahtar ortak bir değere hash olduğunda, bir hash tablosu çarpışması meydana gelir. Bu, iki farklı verinin aynı yuvada saklanamayacağı anlamına gelir.
Hash çarpışmaları şu şekilde önlenebilir:

  • Ayrı zincirleme - Bu yöntemde, ortak bir yuvaya hashing yapan birden çok öğeyi depolamak için bir veri yapısı kullanılır.
  • Açık adresleme – Bu yöntem boş yuvaları arar ve öğeyi mevcut ilk boş yuvada saklar.
Veri Bilimi İçin İstatistiğin Temel Temelleri

16. “Zaman Serisi Analizi”ni tanımlayın.

Seri analizi genellikle iki alanda gerçekleştirilebilir – zaman alanı ve frekans alanı.
Zaman serisi analizi, üstel düzgünleştirme, log-lineer regresyon yöntemi gibi teknikler kullanılarak geçmişte toplanan verilerin analiz edilmesiyle bir sürecin çıktı tahmininin yapıldığı yöntemdir.

17. Çok kaynaklı sorunları nasıl çözmelisiniz?

Çok kaynaklı sorunları çözmek için yapmanız gerekenler:

  • Benzer veri kayıtlarını belirleyin ve bunları, fazlalık eksi tüm yararlı öznitelikleri içerecek şekilde tek bir kayıtta birleştirin.
  • Şema yeniden yapılandırma yoluyla şema entegrasyonunu kolaylaştırın.

18. Bir Veri Analizi projesinin adımlarından bahsedin.

Bir Veri Analizi projesinin temel adımları şunları içerir:

  • Bir Veri Analizi projesinin en önemli gereksinimi, iş gereksinimlerinin derinlemesine anlaşılmasıdır.
  • İkinci adım, iş gereksinimlerine en uygun veri kaynaklarını belirlemek ve verileri güvenilir ve doğrulanmış kaynaklardan elde etmektir.
  • Üçüncü adım, veri kümelerini keşfetmeyi, verileri temizlemeyi ve eldeki verileri daha iyi anlamak için bunları düzenlemeyi içerir.
  • Dördüncü adımda, Veri Analistleri verileri doğrulamalıdır.
  • Beşinci adım, veri kümelerinin uygulanmasını ve izlenmesini içerir.
  • Son adım, en olası sonuçların bir listesini oluşturmak ve istenen sonuçlar elde edilene kadar yinelemek.

19. Bir Veri Analistinin veri analizi yaparken karşılaşabileceği sorunlar nelerdir?

Bilmeniz gereken kritik bir veri analisti görüşme sorusu. Bir Veri Analisti, veri analizi yaparken aşağıdaki sorunlarla karşılaşabilir:

  • Yinelenen girişlerin varlığı ve yazım hataları. Bu hatalar veri kalitesini engelleyebilir.
  • Güvenilir olmayan kaynaklardan elde edilen düşük kaliteli veriler. Böyle bir durumda, bir Veri Analisti, verileri temizlemek için önemli miktarda zaman harcamak zorunda kalacaktır.
  • Birden çok kaynaktan elde edilen veriler temsilde farklılık gösterebilir. Toplanan veriler temizlenip düzenlendikten sonra birleştirildiğinde, veri sunumundaki farklılıklar analiz sürecinde gecikmeye neden olabilir.
  • Eksik veriler, veri analizi sürecindeki bir diğer önemli zorluktur. Kaçınılmaz olarak hatalı veya hatalı sonuçlara yol açacaktır.

20. İyi bir veri modelinin özellikleri nelerdir?

Bir veri modelinin iyi ve gelişmiş olarak kabul edilebilmesi için aşağıdaki özellikleri göstermesi gerekir:

  • Sonuçların doğru veya en azından yakın doğrulukla tahmin edilebilmesi için öngörülebilir bir performansa sahip olmalıdır.
  • Zaman zaman artan iş ihtiyaçlarını karşılayabilmesi için değişikliklere uyarlanabilir ve duyarlı olmalıdır.
  • Verilerdeki değişikliklerle orantılı olarak ölçeklenebilmelidir.
  • Müşterilerin/müşterilerin somut ve karlı sonuçlar elde etmelerini sağlamak için tüketilebilir olmalıdır.

21. Varyans ve kovaryans arasındaki farkı ayırt edin.

Varyans ve kovaryans, istatistiksel terimlerdir. Varyans, iki sayının (miktarların) ortalama değere göre ne kadar uzak olduğunu gösterir. Böylece, yalnızca iki nicelik arasındaki ilişkinin büyüklüğünü bileceksiniz (verinin ortalamaya ne kadar yayıldığı). Aksine kovaryans, iki rastgele değişkenin birlikte nasıl değişeceğini gösterir. Böylece kovaryans, iki niceliğin birbirine göre nasıl değiştiğinin hem yönünü hem de büyüklüğünü verir.

22. “Normal Dağılım”ı açıklayın.

Popüler veri analisti mülakat sorularından biri. Daha iyi Bell Eğrisi veya Gauss eğrisi olarak bilinen normal dağılım, bir değişkenin değerlerinin nasıl dağıldığını, yani ortalamaları ve standart sapmaları bakımından nasıl farklı olduklarını tanımlayan ve ölçen bir olasılık fonksiyonuna atıfta bulunur. Eğride dağılım simetriktir. Gözlemlerin çoğu merkezi tepe noktası etrafında kümelenirken, değerlerin olasılıkları ortalamadan uzaklaşarak her iki yönde de eşit olarak incelir.

23. Tek değişkenli, iki değişkenli ve çok değişkenli analizi açıklayın.

Tek değişkenli analiz, tek bir değişken içeren veri kümelerine uygulanan tanımlayıcı bir istatistiksel tekniği ifade eder. Tek değişkenli analiz, değerlerin aralığını ve ayrıca değerlerin merkezi eğilimini dikkate alır.

İki değişkenli analiz, aralarında ampirik bir ilişkinin olanaklarını keşfetmek için iki değişkeni aynı anda analiz eder. İki değişken arasında bir ilişki olup olmadığı ve ilişkinin gücü veya değişkenler arasında farklılık olup olmadığı ve bu farklılıkların öneminin ne olduğu tespit edilmeye çalışılır.

Çok değişkenli analiz, iki değişkenli analizin bir uzantısıdır. Çok değişkenli istatistik ilkelerine dayalı olarak, çok değişkenli analiz, bireysel denekler için bir bağımlı değişkenin değerini tahmin etmek için birden fazla değişkeni (iki veya daha fazla bağımsız değişken) aynı anda gözlemler ve analiz eder.

24. R-Kare ve Düzeltilmiş R-Kare arasındaki farkı açıklayın.

R-Kare tekniği, bağımsız değişkenler tarafından açıklandığı gibi, bağımlı değişkenlerdeki varyasyon oranının istatistiksel bir ölçüsüdür. Düzeltilmiş R-Kare, esasen, bir modeldeki tahmin edicilerin sayısı için ayarlanmış, R-kare'nin değiştirilmiş bir versiyonudur. Bağımlı değişkenler üzerinde doğrudan etkisi olan belirli bağımsız değişkenler tarafından açıklanan varyasyon yüzdesini sağlar.

25. Versiyon kontrolünün avantajları nelerdir?

Sürüm kontrolünün başlıca avantajları şunlardır:

  • Dosyaları karşılaştırmanıza, farklılıkları belirlemenize ve değişiklikleri sorunsuz bir şekilde birleştirmenize olanak tanır.
  • Hangi sürümün hangi kategori altında olduğunu (geliştirme, test, KG ve üretim) belirleyerek uygulama derlemelerinin izlenmesine yardımcı olur.
  • Merkezi bir sunucu arızası olması durumunda kullanışlı olan proje dosyalarının eksiksiz bir geçmişini tutar.
  • Kod dosyalarının birden çok sürümünü ve türevini güvenli bir şekilde depolamak ve sürdürmek için mükemmeldir.
  • Farklı dosyaların içeriğinde yapılan değişiklikleri görmenizi sağlar.

26. Bir Veri Analisti, bir Excel sayfasında negatif değerler içeren hücreleri nasıl vurgulayabilir?

Veri analisti görüşme soruları ve cevapları rehberimizin son sorusu. Bir Veri Analisti, bir Excel sayfasında negatif değerlere sahip hücreleri vurgulamak için koşullu biçimlendirme kullanabilir. Koşullu biçimlendirme için adımlar şunlardır:

  • İlk olarak, negatif değerlere sahip hücreleri seçin.
  • Şimdi Giriş sekmesine gidin ve Koşullu Biçimlendirme seçeneğini seçin.
  • Ardından, Hücre Kurallarını Vurgula'ya gidin ve Daha Az seçeneğini seçin.
  • Son adımda Küçüktür seçeneğinin diyalog kutusuna gitmeli ve değer olarak “0” girmelisiniz.

Çözüm

Bununla beraber veri analisti mülakat soruları ve cevapları rehberimizin de sonuna gelmiş oluyoruz. Bu veri analisti görüşme soruları, geniş bir olası soru havuzundan seçilmiş olsa da, hevesli bir veri analisti iseniz, bunlar en çok karşılaşacağınız sorulardır. Bu sorular, herhangi bir veri analisti görüşmesi için temel oluşturur ve bunların yanıtlarını bilmek sizi uzun bir yol kat edecektir!

Hızlı teknolojik gelişmelerin önünde olmak için derinlemesine veri analitiği, veri bilimi öğrenmeyi merak ediyorsanız, upGrad & IIIT-B'nin Veri Biliminde Yönetici PG Programına göz atın.

Veri analitiği endüstrisindeki yetenek eğilimleri nelerdir?

Veri Bilimi kademeli olarak büyürken, bazı alanlarda da önemli bir büyüme var. Bu alanlar şunlardır: Veri bilimi ve veri analizi endüstrisinin önemli ölçüde büyümesiyle birlikte, giderek daha fazla sayıda veri mühendisi açığı oluşuyor ve bu da daha fazla BT uzmanına olan talebi artırıyor. Teknolojinin ilerlemesiyle birlikte, veri bilimcilerinin rolü yavaş yavaş gelişiyor. Analitik görevler otomatik hale geliyor ve bu da veri bilimcilerini geri plana atıyor. Otomasyon, veri bilimcilerinin şu anda zamanlarının %70-80'ini harcadıkları veri hazırlama görevlerini üstlenebilir.

Kümeleme analizini ve özelliklerini açıklar.

Bir nesneyi etiketlemeden tanımladığımız sürece küme analizi denir. Diskriminant analizinde olduğu gibi, çeşitli benzer nesneleri tek bir kümede gruplandırmak için veri madenciliğini kullanır. Uygulamaları, örüntü tanıma, bilgi analizi, görüntü analizi, makine öğrenimi, bilgisayar grafikleri ve diğer çeşitli alanları içerir. Küme analizi, birçok yönden birbirinden farklı birkaç algoritma kullanılarak gerçekleştirilen ve böylece bir küme oluşturan bir görevdir. Aşağıdakiler, küme analizinin özelliklerinden bazılarıdır: Küme Analizi, yüksek düzeyde ölçeklenebilir. Farklı bir dizi özellik ile başa çıkabilir. Yüksek boyutluluk, yorumlanabilirlik gösterir. Makine öğrenimi ve bilgi toplama dahil birçok alanda faydalıdır.

Aykırı değerler nelerdir ve bunlarla nasıl başa çıkılır?

Aykırı değerler, verilerinizdeki anormalliklere veya küçük farklılıklara atıfta bulunur. Veri toplama sırasında olabilir. Veri setinde bir aykırı değeri tespit etmenin 4 yolu vardır. Bu yöntemler aşağıdaki gibidir: Boxplot, verileri çeyreklerine göre ayırdığımız bir aykırı değeri tespit etme yöntemidir. Bir dağılım grafiği, 2 değişkenin verilerini kartezyen düzlemde işaretlenmiş noktaların bir koleksiyonu şeklinde görüntüler. Bir değişkenin değeri yatay ekseni (x-ais) ve diğer değişkenin değeri dikey ekseni (y ekseni) temsil eder. Z-skorunu hesaplarken merkezden uzaktaki noktaları arar ve uç değer olarak kabul ederiz.