前 20 名最受歡迎的數據建模面試問題和答案 [適合初學者和有經驗者]

已發表: 2021-06-10

數據科學是當前就業市場中最賺錢的職業領域之一。 隨著競爭的加劇,求職面試也越來越具有創新性。 雇主希望測試候選人的概念知識和對相關科目和技術工具的實際理解。 在這篇博客中,我們將討論一些相關的數據建模面試問題,以幫助您留下深刻的第一印象!

目錄

頂級數據建模面試問題和答案

這裡有 20 個數據建模面試問題以及示例答案,將帶您了解該主題的初級、中級和高級水平。

1. 什麼是數據建模? 列出數據模型的類型。

數據建模涉及創建可用數據的表示(或模型)並將其存儲在數據庫中。

數據模型包含產生用戶想要跟踪的對象和屬性的實體(例如客戶、產品、製造商和銷售商)。 例如,客戶名稱是客戶實體的一個屬性。 這些細節進一步採取數據庫中表的形式。

有三種基本類型的數據模型,即:

  • 概念:數據架構師和業務利益相關者創建此模型來組織、範圍和定義業務概念。 它規定了一個系統應該包含什麼。
  • 邏輯:這個模型由數據架構師和業務分析師組合在一起,映射技術規則和數據結構,從而確定係統的實現,無論是數據庫管理系統還是 DBMS。
  • 物理:數據庫架構師和開發人員創建此模型來描述系統應如何與特定 DBMS 一起運行。

2. 什麼是表? 解釋事實和事實表。

表格以行(水平對齊)和列(垂直對齊)保存數據。 行也稱為記錄或元組,而列可以稱為字段。

事實是定量數據,例如“淨銷售額”或“應付金額”。 事實表存儲數字數據以及維度表中的一些屬性。

3. (i) 維度 (ii) 粒度 (iv) 數據稀疏性 (v) 散列 (v) 數據庫管理系統是什麼意思?

(i) 維度代表定性數據,例如類別和產品。 因此,包含產品數據的維度表將具有產品類別、產品名稱等屬性。

(ii) 粒度是指存儲在表中的信息級別。 它可以是高或低,表分別包含事務級數據和事實表。

(iii) 數據稀疏性是指數據庫中空單元格的數量。 換句話說,它說明了我們對於數據模型中的特定實體或維度有多少數據。 信息不足會導致大型數據庫,因為需要更多空間來保存聚合。

(iv) 散列技術有助於搜索索引值以檢索所需數據。 它用於借助索引結構計算數據記錄的直接位置。

(v) 數據庫管理系統 (DBMS) 是包含一組用於操作數據庫的程序的軟件。 它的主要目的是存儲和檢索用戶數據。

4. 定義標準化。 它的目的是什麼?

規範化技術將較大的表劃分為較小的表,使用不同的關係將它們鏈接起來。 它以最小化數據的依賴性和冗餘性的方式組織表。

可以有五種類型的標準化,即:

  • 第一範式
  • 第二範式
  • 第三範式
  • Boyce-Codd 第四範式
  • 第五範式

5. 非規範化在數據建模中的用途是什麼?

非規範化用於構建數據倉庫,尤其是在涉及大量表的情況下。 此策略用於先前規範化的數據庫。

6. 闡明主鍵、複合主鍵、外鍵和代理鍵之間的區別。

主鍵是每個數據表中的支柱。 它表示一列或一組列,並允許您識別表的行。 主鍵值不能為空。 當應用多個列作為主鍵的一部分時,它被稱為複合主鍵。

另一方面,外鍵是一組允許您鏈接父表和子表的屬性。 子表中的外鍵值被引用為父表中的主鍵值。

在用戶沒有自然主鍵的情況下,代理鍵用於標識每條記錄。 這個人工鍵通常表示為一個整數,並且對錶中包含的數據沒有任何意義。

7.比較OLTP系統和OLAP流程。

OLTP 是一種在線事務系統,它依賴於傳統數據庫來執行實時業務操作。 OLTP 數據庫有規範化的表,響應時間通常在毫秒內。

相反,OLAP 是一個用於數據分析和檢索的在線過程。 它旨在按類別和屬性分析大量業務度量。 與 OLTP 不同,OLAP 使用數據倉庫、非規範化表,並以幾秒到幾分鐘的響應時間運行。

8. 列出標準數據庫模式設計。

模式是數據關係和結構的圖表或說明。 數據建模中有兩種模式設計,即星型模式和雪花模式。

  • 星型模式包括一個中心事實表和幾個與之相連的維度表。 維度表的主鍵是事實表中的外鍵。
  • 雪花模式與星型模式具有相同的事實表,但標準化程度更高。 維度表被規範化或具有多層,類似於雪花。

9. 解釋離散和連續數據。

離散的數據是有限的、有定義的,比如性別、電話號碼等。另一方面,連續的數據是有序變化的; 例如,年齡、溫度等。

10.什麼是序列聚類和時間序列算法?

序列聚類算法收集:

  • 具有事件的數據序列,以及
  • 相關或相似的路徑。

時間序列算法預測數據表中的連續值。 例如,它可以根據員工一段時間內的表現預測銷售和利潤數據。

現在您已經復習了基礎知識,這裡有十個常見的數據建模問題供您練習!

11. 描述數據倉庫的過程。

數據倉庫連接和管理來自異構來源的原始數據。 這種數據收集和分析過程允許企業在一個地方從不同位置獲得有意義的見解,這構成了商業智能的核心。

12. 數據集市和數據倉庫之間的主要區別是什麼?

數據集市通過專注於單一業務領域並遵循自下而上的模型,為業務增長提供戰術決策。 另一方面,數據倉庫通過強調多個領域和數據源並採用自上而下的方法來促進戰略決策。

13. 提及在數據模型中發現的關鍵關係類型。

關鍵關係可分為:

  • 標識:用粗線連接父表和子表。 子表的引用列是主鍵的一部分。
  • Non-identifying:表之間用虛線連接,表示子表的引用列不是主鍵的一部分。
  • Sef-recursive:表的一個獨立列以遞歸關係連接到主鍵。

14.您在建模數據時遇到的一些常見錯誤是什麼?

構建廣泛的數據模型可能會變得很棘手。 當表運行高於 200 時,失敗的可能性也會增加。對於數據建模者來說,對業務任務有足夠的可行知識也很重要。 否則,數據模型就有失控的風險。

不必要的代理鍵帶來了另一個問題。 不能少用它們,但只有在自然鍵不能滿足主鍵的作用時才可以使用。

人們還可能遇到不適當的非規範化情況,其中維護數據冗餘可能成為一項相當大的挑戰。

15. 討論分層 DBMS。 這種數據模型的缺點是什麼?

分層 DBMS 以樹狀結構存儲數據。 該格式使用父子關係,其中父母可能有很多孩子,但孩子只能有一個父母。

該模型的缺點包括:

  • 對不斷變化的業務需求缺乏靈活性和適應性;
  • 跨部門、跨機構和垂直溝通的問題;
  • 數據不統一的問題。

16. 詳述兩類數據建模技術。

實體關係 (ER) 和統一建模語言 (UML) 是兩種標準的數據建模技術。

ER 在軟件工程中用於生成信息系統的數據模型或圖表。 UML 是一種用於數據庫開發和建模的通用語言,有助於可視化系統設計。

17. 什麼是垃圾維度?

垃圾維度是通過將低基數屬性(指標、布爾值或標誌值)組合成一個維度而產生的。 這些值從其他表中刪除,然後分組或“垃圾”到抽象維度表中,這是在數據倉庫中啟動“快速變化維度”的一種方法。

18.陳述一些流行的DBMS軟件。

MySQL、Oracle、Microsoft Access、dBase、SQLite、PostgreSQL、IBM DB2 和 Microsoft SQL Server 是現代軟件開發領域最常用的一些 DBMS 工具。

19. 使用數據建模的優缺點是什麼?

使用數據挖掘的優點:

  • 通過規範化和定義屬性,可以更好地管理業務數據。
  • 數據挖掘允許跨系統集成數據並減少冗餘。
  • 它為高效的數據庫設計讓路。
  • 它支持跨部門合作和團隊合作。
  • 它允許輕鬆訪問數據。

使用數據建模的缺點:

  • 數據建模有時會使系統更加複雜。
  • 它具有有限的結構依賴性。

20. 解釋數據挖掘和預測建模分析。

數據挖掘是一門多學科的技能。 它涉及應用人工智能 (AI)、機器學習 (ML) 和數據庫技術等領域的知識。 在這裡,從業者關注的是揭開數據的奧秘和發現以前未知的關係。

預測建模是指測試和驗證可以預測特定結果的模型。 這個過程在人工智能、機器學習和統計學中有幾個應用。

有抱負的數據建模師的職業見解

無論您是在尋找一份新工作、升職還是職業轉型,提升相關學科的技能都可以大大提高您的招聘機會。

您應該考慮查看 IIIT-B 和 upGrad 的數據科學執行 PG 計劃,該計劃是為在職專業人士創建的,並提供 10 多個案例研究和項目、實用的實踐研討會、與行業專家的指導、與行業導師的一對一, 400 多個小時的學習和頂級公司的工作協助。

有了這個,我們結束了關於數據建模工作和麵試的討論。 我們確信,上述建模面試問題和答案的數據將幫助您明確您的問題領域並在安置過程中表現更好!

數據建模師一年能賺多少錢?

有很多因素會真正影響數據建模領域任何人的薪水。 平均而言,數據建模師的薪水為盧比。 每年12,00,000。 這在很大程度上取決於與您合作的公司。 即使您是作為數據建模者開始的,最低的套餐也是盧比。 每年 600,000 元,而最高的套餐可以預期高達盧比。 每年20,00,000。

數據建模面試難嗎?

數據建模是一個新興領域,市場需求巨大。 另一方面,精通數據建模的專業人士數量相當少。 如果你沒有做好充分的準備,面試可能看起來有點困難,但你可以期待一個體面的面試,並做好適當的準備。
除了清除數據建模的基礎知識外,您還應該更喜歡了解一些最常見的面試問題。 這將使您更容易回答面試中提出的問題,因為您已經對所提出的不同問題以及回答方式有所了解。

我需要具備哪些技能才能成為數據建模師?

成為數據建模師所需的技能與進入系統管理或編程所需的技能完全不同。 通常,這些類型的工作需要技術技能,但這裡的情況有所不同。 成為數據建模師需要精通邏輯方面。 需要培養的一些關鍵技能是:
1. 概念設計
2. 內部溝通
3. 用戶溝通
4.抽象思維
即使你在技術方面不是很精通,如果你能抽像地和概念地思考,你也可以找到一份數據建模師的工作。