가장 인기 있는 데이터 모델링 인터뷰 질문 및 답변 상위 20개 [초보자 및 경험자용]

게시 됨: 2021-06-10

데이터 과학은 현재 직업 시장에서 가장 수익성이 높은 직업 분야 중 하나입니다. 경쟁이 치열해짐에 따라 면접도 날이 갈수록 혁신되고 있습니다. 고용주는 관련 주제 및 기술 도구에 대한 후보자의 개념적 지식과 실용적인 이해를 테스트하기를 원합니다. 이 블로그에서는 강력한 첫인상을 주는 데 도움이 되는 몇 가지 관련 데이터 모델링 인터뷰 질문에 대해 논의할 것입니다!

목차

주요 데이터 모델링 인터뷰 질문 및 답변

다음은 주제의 초급, 중급 및 고급 수준을 안내하는 샘플 답변과 함께 20개의 데이터 모델링 인터뷰 질문입니다.

1. 데이터 모델링이란 무엇입니까? 데이터 모델의 유형을 나열하십시오.

데이터 모델링에는 사용 가능한 데이터의 표현(또는 모델)을 만들고 데이터베이스에 저장하는 작업이 포함됩니다.

데이터 모델은 사용자가 추적하려는 개체 및 속성을 생성하는 엔터티(예: 고객, 제품, 제조업체 및 판매자)로 구성됩니다. 예를 들어, 고객 이름은 고객 엔터티의 속성입니다. 이러한 세부 사항은 데이터베이스의 테이블 형태를 더 많이 취합니다.

데이터 모델에는 세 가지 기본 유형이 있습니다.

  • 개념적: 데이터 설계자와 비즈니스 이해 관계자는 이 모델을 만들어 비즈니스 개념을 구성, 범위 지정 및 정의합니다. 시스템에 포함되어야 하는 내용을 지정합니다.
  • 논리적: 데이터 설계자와 비즈니스 분석가가 함께 사용하는 이 모델은 기술 규칙과 데이터 구조를 매핑하여 데이터베이스 관리 시스템이나 DBMS에 관계없이 시스템 구현을 결정합니다.
  • 물리적: 데이터베이스 설계자와 개발자는 시스템이 특정 DBMS와 함께 작동해야 하는 방법을 설명하기 위해 이 모델을 만듭니다.

2. 테이블이란 무엇입니까? 팩트 및 팩트 테이블을 설명합니다.

테이블은 행(가로 정렬)과 열(세로 정렬)에 데이터를 보유합니다. 행은 레코드 또는 튜플이라고도 하는 반면 열은 필드라고 할 수 있습니다.

사실은 "순매출액" 또는 "미수금"과 같은 양적 데이터입니다. 팩트 테이블은 수치 데이터와 차원 테이블의 일부 속성을 저장합니다.

3. (i) 차원 (ii) 세분성 (iv) 데이터 희소성 (v) 해싱 (v) 데이터베이스 관리 시스템이란 무엇을 의미합니까?

(i) 차원은 등급 및 제품과 같은 정성적 데이터를 나타냅니다. 따라서 제품 데이터를 포함하는 차원 테이블에는 제품 범주, 제품 이름 등과 같은 속성이 있습니다.

(ii) 입도는 테이블에 저장된 정보의 수준을 나타냅니다. 각각 트랜잭션 수준 데이터와 팩트 테이블을 포함하는 테이블과 함께 높거나 낮을 수 있습니다.

(iii) 데이터 희소성은 데이터베이스의 빈 셀 수를 의미합니다. 즉, 데이터 모델의 특정 엔터티 또는 차원에 대해 얼마나 많은 데이터가 있는지 나타냅니다. 정보가 충분하지 않으면 집계를 저장하는 데 더 많은 공간이 필요하므로 데이터베이스가 커집니다.

(iv) 해싱 기술은 원하는 데이터를 검색하기 위해 인덱스 값을 검색하는 데 도움이 됩니다. 인덱스 구조를 사용하여 데이터 레코드의 직접 위치를 계산하는 데 사용됩니다.

(v) 데이터베이스 관리 시스템(DBMS)은 데이터베이스를 조작하기 위한 프로그램 그룹으로 구성된 소프트웨어입니다. 주요 목적은 사용자 데이터를 저장하고 검색하는 것입니다.

4. 정규화를 정의합니다. 그 목적은 무엇입니까?

정규화 기술은 더 큰 테이블을 더 작은 테이블로 나누고 서로 다른 관계를 사용하여 연결합니다. 데이터의 종속성과 중복성을 최소화하는 방식으로 테이블을 구성합니다.

정규화에는 다음과 같은 다섯 가지 유형이 있습니다.

  • 첫 번째 정규형
  • 두 번째 정규형
  • 제3정규형
  • Boyce-Codd 제4정규형
  • 다섯 번째 정규형

5. 데이터 모델링에서 비정규화의 유용성은 무엇입니까?

비정규화는 특히 테이블이 광범위하게 관련된 상황에서 데이터 웨어하우스를 구성하는 데 사용됩니다. 이 전략은 이전에 정규화된 데이터베이스에서 사용됩니다.

6. 기본 키, 복합 기본 키, 외래 키 및 대리 키의 차이점을 설명합니다.

기본 키는 모든 데이터 테이블의 핵심입니다. 열 또는 열 그룹을 나타내며 테이블의 행을 식별할 수 있습니다. 기본 키 값은 null일 수 없습니다. 둘 이상의 열이 기본 키의 일부로 적용되는 경우 이를 복합 기본 키라고 합니다.

반면에 외래 키는 부모 테이블과 자식 테이블을 연결할 수 있는 속성 그룹입니다. 자식 테이블의 외래 키 값은 부모 테이블의 기본 키 값으로 참조됩니다.

대리 키는 사용자에게 기본 키가 없는 상황에서 각 레코드를 식별하는 데 사용됩니다. 이 인공 키는 일반적으로 정수로 표시되며 테이블에 포함된 데이터에 의미를 부여하지 않습니다.

7. OLTP 시스템을 OLAP 프로세스와 비교합니다.

OLTP는 실시간 비즈니스 운영을 수행하기 위해 기존 데이터베이스에 의존하는 온라인 트랜잭션 시스템입니다. OLTP 데이터베이스에는 정규화된 테이블이 있으며 응답 시간은 일반적으로 밀리초 이내입니다.

반대로 OLAP는 데이터 분석 및 검색을 위한 온라인 프로세스입니다. 카테고리 및 속성별로 대량의 비즈니스 측정치를 분석하기 위해 설계되었습니다. OLTP와 달리 OLAP는 데이터 웨어하우스, 비정규화 테이블을 사용하며 몇 초에서 몇 분의 응답 시간으로 작동합니다.

8. 표준 데이터베이스 스키마 디자인을 나열합니다.

스키마는 데이터 관계 및 구조의 다이어그램 또는 그림입니다. 데이터 모델링에는 스타 스키마와 눈송이 스키마의 두 가지 스키마 디자인이 있습니다.

  • 스타 스키마는 중앙 팩트 테이블과 여기에 연결된 여러 차원 테이블로 구성됩니다. 차원 테이블의 기본 키는 팩트 테이블의 외래 키입니다.
  • 눈송이 스키마는 스타 스키마와 동일한 팩트 테이블을 갖지만 더 높은 수준의 정규화에 있습니다. 차원 테이블은 정규화되거나 눈송이와 유사한 다중 레이어가 있습니다.

9. 이산 및 연속 데이터를 설명합니다.

성별, 전화번호 등과 같이 유한하고 정의된 이산 데이터. 반면에 연속 데이터는 순서대로 변경됩니다. 예를 들어, 나이, 온도 등.

10. 시퀀스 클러스터링 및 시계열 알고리즘이란 무엇입니까?

시퀀스 클러스터링 알고리즘은 다음을 수집합니다.

  • 이벤트가 있는 데이터 시퀀스 및
  • 관련 또는 유사한 경로.

시계열 알고리즘은 데이터 테이블의 연속 값을 예측합니다. 예를 들어, 시간 경과에 따른 직원 성과를 기반으로 매출 및 이익 수치를 예측할 수 있습니다.

이제 기본 사항을 닦았으므로 실습을 위해 자주 묻는 10가지 데이터 모델링 질문이 있습니다!

11. 데이터 웨어하우징 프로세스를 설명합니다.

데이터 웨어하우징은 이기종 소스의 원시 데이터를 연결하고 관리합니다. 이 데이터 수집 및 분석 프로세스를 통해 비즈니스 기업은 비즈니스 인텔리전스의 핵심을 형성하는 다양한 위치에서 의미 있는 통찰력을 한 곳에서 얻을 수 있습니다.

12. 데이터 마트와 데이터 웨어하우스의 주요 차이점은 무엇입니까?

데이터 마트는 단일 비즈니스 영역에 집중하고 상향식 모델을 따름으로써 비즈니스 성장을 위한 전술적 결정을 가능하게 합니다. 반면 데이터 웨어하우스는 여러 영역과 데이터 소스를 강조하고 하향식 접근 방식을 채택하여 전략적 의사 결정을 용이하게 합니다.

13. 데이터 모델에서 발견되는 중요한 관계의 유형을 언급하십시오.

중요한 관계는 다음과 같이 분류할 수 있습니다.

  • 식별: 부모 테이블과 자식 테이블을 굵은 선으로 연결합니다. 자식 테이블의 참조 열은 기본 키의 일부입니다.
  • 비식별: 테이블이 점선으로 연결되어 하위 테이블의 참조 열이 기본 키의 일부가 아님을 나타냅니다.
  • Sef-recursive: 테이블의 독립형 열은 재귀 관계에서 기본 키에 연결됩니다.

14. 데이터를 모델링하는 동안 발생하는 일반적인 오류에는 어떤 것이 있습니까?

광범위한 데이터 모델을 구축하는 것은 까다로울 수 있습니다. 테이블이 200개보다 높을 때도 실패 확률이 높아집니다. 데이터 모델러가 비즈니스 미션에 대해 실행 가능한 적절한 지식을 갖는 것도 중요합니다. 그렇지 않으면 데이터 모델이 엉망이 될 위험이 있습니다.

불필요한 대리 키는 또 다른 문제를 야기합니다. 드물게 사용해서는 안 되며 자연 키가 기본 키의 역할을 수행할 수 없는 경우에만 사용해야 합니다.

데이터 중복성을 유지하는 것이 상당한 문제가 될 수 있는 부적절한 비정규화 상황에 직면할 수도 있습니다.

15. 계층적 DBMS에 대해 논의합니다. 이 데이터 모델의 단점은 무엇입니까?

계층적 DBMS는 트리와 같은 구조로 데이터를 저장합니다. 형식은 부모가 많은 자식을 가질 수 있지만 자식은 하나의 부모만 가질 수 있는 부모-자식 관계를 사용합니다.

이 모델의 단점은 다음과 같습니다.

  • 변화하는 비즈니스 요구 사항에 대한 유연성 및 적응성 부족
  • 부서간, 기관간, 수직적 의사소통의 문제
  • 데이터의 불일치 문제.

16. 두 가지 유형의 데이터 모델링 기술을 자세히 설명합니다.

ER(Entity-Relationship) 및 UML(Unified Modeling Language)은 두 가지 표준 데이터 모델링 기술입니다.

ER은 소프트웨어 엔지니어링에서 정보 시스템의 데이터 모델이나 다이어그램을 생성하는 데 사용됩니다. UML은 시스템 설계를 시각화하는 데 도움이 되는 데이터베이스 개발 및 모델링을 위한 범용 언어입니다.

17. 정크 차원이란 무엇입니까?

정크 차원은 낮은 카디널리티 속성(지표, 부울 또는 플래그 값)을 하나의 차원으로 결합하여 생성됩니다. 이러한 값은 다른 테이블에서 제거된 다음 데이터 웨어하우스 내에서 '차원 변경'을 시작하는 방법인 추상 차원 테이블로 그룹화되거나 "정크"됩니다.

18. 몇 가지 인기 있는 DBMS 소프트웨어를 언급하십시오.

MySQL, Oracle, Microsoft Access, dBase, SQLite, PostgreSQL, IBM DB2 및 Microsoft SQL Server는 현대 소프트웨어 개발 분야에서 가장 많이 사용되는 DBMS 도구입니다.

19. 데이터 모델링을 사용할 때의 장점과 단점은 무엇입니까?

데이터 마이닝 사용의 장점:

  • 속성을 정규화하고 정의하면 비즈니스 데이터를 더 잘 관리할 수 있습니다.
  • 데이터 마이닝을 통해 시스템 전반에 걸쳐 데이터를 통합하고 중복성을 줄입니다.
  • 효율적인 데이터베이스 설계를 위한 길을 열어줍니다.
  • 부서 간 협력과 팀워크를 가능하게 합니다.
  • 데이터에 쉽게 액세스할 수 있습니다.

데이터 모델링 사용의 단점:

  • 데이터 모델링은 때때로 시스템을 더 복잡하게 만들 수 있습니다.
  • 제한된 구조적 종속성을 가지고 있습니다.

20. 데이터 마이닝 및 예측 모델링 분석을 설명합니다.

데이터 마이닝은 다분야 기술입니다. 여기에는 인공 지능(AI), 기계 학습(ML) 및 데이터베이스 기술과 같은 분야의 지식을 적용하는 것이 포함됩니다. 여기에서 실무자는 데이터의 신비를 밝히고 이전에 알려지지 않은 관계를 발견하는 데 관심이 있습니다.

예측 모델링은 특정 결과를 예측할 수 있는 모델을 테스트하고 검증하는 것을 말합니다. 이 프로세스에는 AI, ML 및 통계의 여러 응용 프로그램이 있습니다.

데이터 모델러 지망생을 위한 커리어 인사이트

새로운 직업, 승진 또는 경력 전환을 찾고 있든 관련 분야의 기술 향상은 고용 기회를 상당히 향상시킬 수 있습니다.

일하는 전문가를 위해 만들어지고 10개 이상의 사례 연구 및 프로젝트, 실용적인 실습 워크숍, 업계 전문가와의 멘토링, 업계 멘토와의 1:1을 제공하는 데이터 과학의 IIIT-B & upGrad의 이그 제 큐 티브 PG 프로그램을 확인하는 것이 좋습니다. , 일류 기업에서 400시간 이상의 학습 및 취업 지원.

이것으로 데이터 모델링 작업 및 인터뷰에 대한 논의를 마무리합니다. 위에서 언급한 인터뷰 질문 및 답변 모델링 데이터가 문제 영역을 명확히 하고 배치 과정에서 더 나은 성과를 내는 데 도움이 될 것이라고 확신합니다!

Data Modeler는 1년에 얼마를 버나요?

데이터 모델링 분야에서 개인의 급여에 실제로 영향을 미치는 많은 요소가 있습니다. 데이터 모델러의 평균 급여는 100만원이다. 연간 12,000,000. 그것은 당신이 일하는 회사에 많이 의존할 것입니다. 데이터 모델러로 시작하더라도 최저 패키지는 Rs입니다. 연간 600,000, 최고 패키지는 최대 Rs까지 기대할 수 있습니다. 연간 20,000,000.

Data Modeling 인터뷰를 해독하는 것이 어렵습니까?

데이터 모델링은 시장에서 수요가 많은 신흥 분야입니다. 반면에 데이터 모델링에 능숙한 전문가의 수는 상당히 적습니다. 면접 준비를 제대로 하지 않았다면 다소 어렵게 느껴질 수도 있지만, 제대로 준비하면 괜찮은 면접을 기대할 수 있을 것입니다.
데이터 모델링의 기초를 지우는 것과 함께 가장 자주 묻는 인터뷰 질문 중 일부를 살펴보는 것을 선호해야 합니다. 이렇게 하면 다양한 질문과 답변 방법에 대한 아이디어를 이미 알고 있기 때문에 인터뷰에서 묻는 질문에 훨씬 쉽게 답변할 수 있습니다.

데이터 모델러가 되려면 어떤 기술이 필요합니까?

데이터 모델러가 되기 위해 필요한 기술은 시스템 관리나 프로그래밍에 입문하는 데 필요한 기술과 상당히 다릅니다. 일반적으로 이러한 유형의 작업에는 기술이 필요하지만 여기서는 경우가 다릅니다. 데이터 모델러가 되려면 논리적인 측면에 정통해야 합니다. 개발해야 하는 몇 가지 핵심 기술은 다음과 같습니다.
1. 개념적 설계
2. 내부 커뮤니케이션
3. 사용자 커뮤니케이션
4. 추상적 사고
기술적인 면에 능숙하지 못하더라도 추상적으로, 개념적으로 사고할 수 있다면 데이터 모델러로 취업할 수 있습니다.