En Popüler 20 Veri Modelleme Mülakat Soruları ve Cevapları [Yeni Başlayanlar ve Deneyimliler İçin]
Yayınlanan: 2021-06-10Veri Bilimi, mevcut iş piyasasındaki en kazançlı kariyer alanlarından biridir. Ve rekabet arttıkça, iş görüşmeleri de gün geçtikçe daha yenilikçi hale geliyor. İşverenler, adayların ilgili konulara ve teknoloji araçlarına ilişkin kavramsal bilgilerini ve pratik anlayışlarını test etmek ister. Bu blogda, güçlü bir ilk izlenim bırakmanıza yardımcı olacak bazı ilgili veri modelleme mülakat sorularını tartışacağız!
İçindekiler
En İyi Veri Modelleme Mülakat Soruları ve Cevapları
İşte sizi konunun başlangıç, orta ve ileri seviyelerine götürecek örnek cevaplarla birlikte 20 veri modelleme mülakat sorusu.
1. Veri Modelleme Nedir? Veri modeli türlerini listeleyin.
Veri modelleme, mevcut verilerin bir temsilini (veya modelini) oluşturmayı ve bir veritabanında depolamayı içerir.
Bir veri modeli, kullanıcıların izlemek istediği nesnelere ve niteliklere yol açan varlıklardan (müşteriler, ürünler, üreticiler ve satıcılar gibi) oluşur. Örneğin, Müşteri Adı, Müşteri varlığının bir özelliğidir. Bu ayrıntılar ayrıca bir veritabanında bir tablo şeklini alır.
Üç temel veri modeli türü vardır:
- Kavramsal: Veri mimarları ve iş paydaşları, iş kavramlarını düzenlemek, kapsamak ve tanımlamak için bu modeli oluşturur. Bir sistemin neyi içermesi gerektiğini belirler.
- Mantıksal: Veri mimarları ve iş analistleri tarafından bir araya getirilen bu model, teknik kuralları ve veri yapılarını eşler, böylece bir veritabanı yönetim sistemi veya VTYS'den bağımsız olarak sistemin uygulamasını belirler.
- Fiziksel: Veritabanı mimarları ve geliştiricileri, sistemin belirli bir VTYS ile nasıl çalışması gerektiğini açıklamak için bu modeli oluşturur.
2. Tablo Nedir? Olgu ve Olgu Tablosunu açıklayın.
Bir tablo, verileri satırlar (yatay hizalamalar) ve sütunlar (dikey hizalamalar) halinde tutar. Satırlar ayrıca kayıtlar veya demetler olarak bilinirken, sütunlar alanlar olarak ifade edilebilir.
Gerçek, “net satışlar” veya “ödenmesi gereken tutar” gibi nicel verilerdir. Olgu tablosu, sayısal verilerin yanı sıra boyutlu tablolardan bazı öznitelikleri depolar.
3. (i) boyut (ii) ayrıntı düzeyi (iv) veri seyrekliği (v) karma (v) veritabanı yönetim sistemi ile ne demek istiyorsunuz?
(i) Boyutlar, sınıf ve ürün gibi niteliksel verileri temsil eder. Bu nedenle, ürün verilerini içeren boyutlu bir tablo, ürün kategorisi, ürün adı vb. gibi niteliklere sahip olacaktır.
(ii) Parçacıklılık, bir tabloda depolanan bilgi düzeyini ifade eder. Sırasıyla işlem düzeyindeki verileri ve olgu tablolarını içeren tablolarla yüksek veya düşük olabilir.
(iii) Veri seyrekliği, bir veritabanındaki boş hücre sayısı anlamına gelir. Başka bir deyişle, veri modelinde belirli bir varlık veya boyut için ne kadar verimiz olduğunu belirtir. Yetersiz bilgi, toplamaları kaydetmek için daha fazla alan gerektiğinden büyük veritabanlarına yol açar.
(iv) Karma tekniği, istenen verileri almak için dizin değerlerinin aranmasına yardımcı olur. İndeks yapıları yardımıyla veri kayıtlarının doğrudan konumunu hesaplamak için kullanılır.
(v) Bir Veritabanı Yönetim Sistemi (DBMS), veritabanını işlemek için bir grup programdan oluşan bir yazılımdır. Birincil amacı, kullanıcı verilerini depolamak ve almaktır.
4. Normalizasyonu tanımlayın. Amacı nedir?
Normalleştirme tekniği, daha büyük tabloları daha küçük tablolara bölerek onları farklı ilişkiler kullanarak birbirine bağlar. Tabloları, verilerin bağımlılığını ve fazlalığını en aza indirecek şekilde düzenler.
Beş tür normalleştirme olabilir, yani:
- Birincil normal form
- İkinci normal form
- Üçüncü normal form
- Boyce-Codd dördüncü normal form
- Beşinci normal form
5. Veri modellemede denormalizasyonun faydası nedir?
Denormalizasyon, özellikle tabloların kapsamlı bir şekilde dahil olduğu durumlarda bir veri ambarı oluşturmak için kullanılır. Bu strateji, daha önce normalleştirilmiş bir veritabanında kullanılır.
6. Birincil anahtar, birleşik birincil anahtar, yabancı anahtar ve yedek anahtar arasındaki farkları açıklayın.
Birincil anahtar, her veri tablosunda bir dayanak noktasıdır. Bir sütunu veya bir sütun grubunu belirtir ve bir tablonun satırlarını tanımlamanıza olanak tanır. Birincil anahtar değeri boş olamaz. Birincil anahtarın parçası olarak birden fazla sütun uygulandığında, bileşik birincil anahtar olarak bilinir.
Öte yandan, bir yabancı anahtar, üst ve alt tabloları bağlamanıza izin veren bir nitelikler grubudur. Alt tablodaki yabancı anahtar değerine, üst tablodaki birincil anahtar değeri olarak başvurulur.
Kullanıcıların doğal bir birincil anahtarının olmadığı durumlarda her kaydı tanımlamak için bir yedek anahtar kullanılır. Bu yapay anahtar tipik olarak bir tamsayı olarak temsil edilir ve tabloda yer alan verilere herhangi bir anlam katmaz.
7. OLTP sistemini OLAP süreciyle karşılaştırın.
OLTP, gerçek zamanlı iş operasyonlarını gerçekleştirmek için geleneksel veritabanlarına dayanan çevrimiçi bir işlem sistemidir. OLTP veritabanı normalleştirilmiş tablolara sahiptir ve yanıt süresi genellikle milisaniyeler içindedir.
Tersine, OLAP, veri analizi ve alımı için tasarlanmış çevrimiçi bir süreçtir. Büyük hacimli iş ölçümlerini kategori ve niteliklere göre analiz etmek için tasarlanmıştır. OLTP'den farklı olarak OLAP, bir veri ambarı, normalleştirilmemiş tablolar kullanır ve saniyeler ila dakikalar arasında bir yanıt süresiyle çalışır.
8. Standart veritabanı şema tasarımlarını listeleyin.
Şema, veri ilişkilerinin ve yapılarının bir diyagramı veya gösterimidir. Veri modellemede yıldız şeması ve kar tanesi şeması olmak üzere iki şema tasarımı vardır.
- Bir yıldız şeması, merkezi bir olgu tablosundan ve ona bağlı birkaç boyut tablosundan oluşur. Boyut tablolarının birincil anahtarı, olgu tablosundaki bir yabancı anahtardır.
- Bir kar tanesi şeması, yıldız şemasıyla aynı olgu tablosuna sahiptir ancak daha yüksek bir normalizasyon düzeyindedir. Boyut tabloları normalleştirilmiştir veya bir kar tanesine benzeyen birden çok katmana sahiptir.
9. Kesikli ve sürekli verileri açıklar.
Cinsiyet, telefon numarası vb. gibi sonlu ve tanımlı ayrık veriler. Öte yandan, düzenli bir şekilde sürekli veriler değişir; örneğin, yaş, sıcaklık vb.
10. Dizi kümeleme ve zaman serisi algoritmaları nelerdir?
Bir dizi kümeleme algoritması şunları toplar:
- Olayları olan veri dizileri ve
- İlgili veya benzer yollar.
Zaman serisi algoritmaları, veri tablolarındaki sürekli değerleri tahmin eder. Örneğin, zaman içindeki çalışan performansına dayalı satış ve kar rakamlarını tahmin edebilir.
Artık temel bilgilerinizi tazelediğinize göre, işte uygulamanız için on tane daha sık sorulan veri modelleme sorusu!
11. Veri ambarı sürecini açıklayın.
Veri ambarı, heterojen kaynaklardan gelen ham verileri birbirine bağlar ve yönetir. Bu veri toplama ve analiz süreci, ticari kuruluşların, İş Zekası'nın özünü oluşturan tek bir yerde çeşitli konumlardan anlamlı içgörüler elde etmelerini sağlar.
12. Data mart ile veri ambarı arasındaki temel farklar nelerdir?
Bir data mart, tek bir iş alanına odaklanarak ve aşağıdan yukarıya bir model izleyerek iş büyümesi için taktiksel kararlar alınmasını sağlar. Öte yandan, bir veri ambarı, birden fazla alanı ve veri kaynağını vurgulayarak ve yukarıdan aşağıya bir yaklaşım benimseyerek stratejik karar vermeyi kolaylaştırır.
13. Veri modellerinde bulunan kritik ilişki türlerinden bahsedin.
Kritik ilişkiler şu şekilde sınıflandırılabilir:
- Tanımlama: Üst ve alt tabloları kalın bir çizgi ile birleştirir. Alt tablonun başvuru sütunu, birincil anahtarın bir parçasıdır.
- Tanımlayıcı olmayan: Tablolar, alt tablonun referans sütununun birincil anahtarın bir parçası olmadığını gösteren noktalı bir çizgiyle bağlanır.
- Sef-özyinelemeli: Tablonun bağımsız bir sütunu, yinelemeli bir ilişkide birincil anahtara bağlanır.
14. Verileri modellerken karşılaştığınız bazı yaygın hatalar nelerdir?
Geniş veri modelleri oluşturmak zor olabilir. Tablolar 200'den daha yüksek olduğunda başarısızlık şansı da artar. Veri modelleyicilerin iş misyonu hakkında yeterli uygulanabilir bilgiye sahip olması da kritik önem taşır. Aksi takdirde, veri modelleri kontrolden çıkma riskini taşır.
Gereksiz yedek anahtarlar başka bir sorun teşkil eder. Bunlar idareli olarak kullanılmamalıdır, ancak yalnızca doğal anahtarlar birincil anahtarın rolünü yerine getiremediğinde kullanılmalıdır.
Veri fazlalığının sürdürülmesinin önemli bir zorluk haline gelebileceği uygun olmayan denormalizasyon durumlarıyla da karşılaşılabilir.
15. Hiyerarşik VTYS'yi tartışın. Bu veri modelinin dezavantajları nelerdir?
Hiyerarşik bir VTYS, verileri ağaç benzeri yapılarda depolar. Biçim, bir ebeveynin birçok çocuğu olabileceği, ancak bir çocuğun yalnızca bir ebeveyni olabileceği ebeveyn-çocuk ilişkisini kullanır.
Bu modelin dezavantajları şunları içerir:
- Değişen iş gereksinimlerine esneklik ve uyarlanabilirlik eksikliği;
- Bölümler arası, kurumlar arası ve dikey iletişimdeki sorunlar;
- Verilerdeki ayrıklık sorunları.
16. İki tür veri modelleme tekniğini detaylandırın.
Varlık-İlişki (ER) ve Birleşik Modelleme Dili (UML), iki standart veri modelleme tekniğidir.
ER, yazılım mühendisliğinde veri modelleri veya bilgi sistemlerinin diyagramlarını üretmek için kullanılır. UML, sistem tasarımını görselleştirmeye yardımcı olan veritabanı geliştirme ve modelleme için genel amaçlı bir dildir.
17. Önemsiz boyut nedir?
Önemsiz bir boyut, düşük kardinalite özniteliklerinin (göstergeler, boole değerleri veya bayrak değerleri) tek bir boyutta birleştirilmesiyle oluşturulur. Bu değerler diğer tablolardan kaldırılır ve daha sonra gruplandırılır veya veri ambarlarında 'Hızla Değişen Boyutları' başlatma yöntemi olan soyut bir boyut tablosunda "çöplenir".
18. Bazı popüler DBMS yazılımlarını belirtin.
MySQL, Oracle, Microsoft Access, dBase, SQLite, PostgreSQL, IBM DB2 ve Microsoft SQL Server, günümüz yazılım geliştirme alanında en çok kullanılan DBMS araçlarından bazılarıdır.
19. Veri modellemeyi kullanmanın avantajları ve dezavantajları nelerdir?
Veri madenciliğini kullanmanın artıları:
- İş verileri, öznitelikleri normalleştirerek ve tanımlayarak daha iyi yönetilebilir.
- Veri madenciliği, verilerin sistemler arasında entegrasyonunu sağlar ve fazlalığı azaltır.
- Verimli bir veritabanı tasarımı için yol açar.
- Departmanlar arası işbirliğini ve ekip çalışmasını sağlar.
- Verilere kolay erişim sağlar.
Veri modelleme kullanmanın eksileri:
- Veri modelleme bazen sistemi daha karmaşık hale getirebilir.
- Sınırlı bir yapısal bağımlılığa sahiptir.
20. Veri madenciliği ve tahmine dayalı modelleme analitiğini açıklayın.
Veri madenciliği çok disiplinli bir beceridir. Yapay Zeka (AI), Makine Öğrenimi (ML) ve Veritabanı Teknolojileri gibi alanlardan gelen bilgilerin uygulanmasını içerir. Burada uygulayıcılar, verilerin gizemlerini ortaya çıkarmak ve daha önce bilinmeyen ilişkileri keşfetmekle ilgilenirler.
Tahmine dayalı modelleme, belirli sonuçları tahmin edebilen modellerin test edilmesi ve doğrulanması anlamına gelir. Bu işlemin AI, ML ve İstatistik'te çeşitli uygulamaları vardır.
Hevesli Veri Modelleyiciler için Kariyer İçgörüleri
Yeni bir iş, terfi veya kariyer geçişi arıyorsanız, ilgili bir disiplinde beceri kazanmak, işe alma şansınızı önemli ölçüde artırabilir.
IIIT-B & upGrad'ın çalışan profesyoneller için oluşturulmuş ve 10'dan fazla vaka çalışması ve proje, uygulamalı uygulamalı atölye çalışmaları, endüstri uzmanlarıyla mentorluk, endüstri danışmanlarıyla 1'e 1 danışmanlık sunan Veri Biliminde Yönetici PG Programına göz atmayı düşünmelisiniz. , En iyi firmalarla 400+ saat öğrenim ve iş yardımı.
Bununla, veri modelleme işleri ve röportajlar hakkındaki bu tartışmayı sonlandırıyoruz. Mülakat sorularını ve cevaplarını modellemek için yukarıda belirtilen verilerin, sorunlu alanlarınızı netleştirmenize ve yerleştirme sürecinde daha iyi performans göstermenize yardımcı olacağından eminiz!
Veri modelleme alanında herhangi bir kişinin maaşını gerçekten etkileyecek birçok faktör vardır. Ortalama olarak, bir veri modelleyicisinin maaşı Rs'dir. Yılda 12.000.000. Çalıştığınız şirkete çok bağlı olacaktır. Veri modelleyici olarak başlasanız bile, en düşük paket Rs'dir. Yılda 600.000, en yüksek paket ise Rs'ye kadar bekleyebilir. Yılda 20.000.000. Veri modelleme, pazarda büyük talep gören gelişmekte olan bir alandır. Öte yandan, veri modelleme konusunda yetkin profesyonellerin sayısı oldukça azdır. Düzgün hazırlanmadıysanız, görüşme biraz zor görünebilir, ancak uygun bir hazırlıkla iyi bir röportaj bekleyebilirsiniz. Veri modelleyici olmak için gereken beceriler, sistem yönetimi veya programlamaya girmek için gerekenlerden oldukça farklıdır. Genellikle bu tür işler teknik beceriler gerektirir, ancak burada durum farklıdır. Veri modelleyici olmak için mantıksal açıdan çok bilgili olmak gerekir. Bir kişinin geliştirmesi gereken temel becerilerden bazıları şunlardır:Bir Veri Modelleyici yılda ne kadar kazanır?
Bir Veri Modelleme röportajını kırmak zor mu?
Veri modellemenin temellerini açıklamanın yanı sıra, en sık sorulan mülakat sorularından bazılarını da incelemeyi tercih etmelisiniz. Bu, sorulan farklı sorular ve bunları yanıtlama şekli hakkında zaten bir fikriniz olduğundan, görüşmede sorulan soruları yanıtlamanızı çok daha kolay hale getirecektir. Veri Modelleyici olmak için hangi becerilere sahip olmam gerekiyor?
1. Kavramsal Tasarım
2. İç İletişim
3. Kullanıcı İletişimi
4. Soyut Düşünme
Teknik açıdan çok yetkin olmasanız bile, soyut ve kavramsal olarak düşünebilirseniz veri modelleyici olarak iş bulabilirsiniz.