가장 많이 묻는 인재 인터뷰 질문 및 답변 22 [신입생 및 경험자용]

게시 됨: 2021-01-21

데이터 통합을 현대화하려는 의도로 시작된 Talend는 오늘날 최고의 클라우드 및 데이터 통합 ​​소프트웨어가 되기 위한 도약을 거듭했습니다. Talend 자격증은 매우 가치 있는 능력으로 여겨지며, 요즘 기업들은 Talend 전문인력 채용을 적극적으로 모색하고 있습니다.

따라서 지금이 자신을 준비하고 경쟁에서 앞서 나갈 수 있는 적절한 시기일 수 있습니다.

여기, 우리는 Talend 인터뷰에 성공하고 꿈의 직업을 찾는 데 도움이 될 수 있는 최고의 Talend 인터뷰 질문과 답변을 선택하고 편집했습니다.

자, 이제 자주 묻는 인재상 면접 질문을 살펴보겠습니다.

최고의 인재 인터뷰 질문 및 답변

질문 1: Talend가 무엇인가요?

Talend는 데이터 통합에 사용되는 오픈 소스 ETL(Extract, Transform Load) 도구입니다. 데이터 관리, 데이터 준비, 클라우드 스토리지, 빅 데이터, 데이터 품질 및 엔터프라이즈 애플리케이션 통합을 위한 솔루션을 제공하는 다양한 소프트웨어가 있습니다.

이를 통해 기업은 실시간으로 서로 안전하게 통신하고 지속적인 지속 가능성을 위해 데이터 기반 의사 결정을 내릴 수 있습니다.

질문 2: 다른 ETL 도구에 비해 Talend를 사용하면 어떤 이점이 있습니까?

  1. Talend는 오픈 소스 도구이므로 대규모 개발자 커뮤니티의 지원을 받습니다.
  2. Talend 작업은 자동화되고 원활하게 유지되므로 데이터 통합이 더 빨라집니다.
  3. Talend는 조직이 필요로 하는 통합 환경을 제공합니다.
  4. Talend는 차세대 소프트웨어입니다. 즉, 현재 및 미래의 요구 사항을 충족하도록 제작되었습니다.
  5. Talend는 기본 성능과 높은 데이터 품질을 제공하는 셀프 서비스 플랫폼입니다.

질문 3: Talend에서 '프로젝트'를 설명합니까?

'프로젝트'는 기술 리소스의 컴파일 및 저장을 담당하는 Talend의 최상위 물리적 구조로 설명됩니다. 이러한 리소스 중 일부는 다음과 같습니다.

  • 비즈니스 모델
  • 메타데이터
  • 채용 정보
  • 컨텍스트 변수
  • 루틴

질문 4: 작업 디자인이란 무엇입니까?

Talend의 작업은 기술적인 측면에서 단일 Java 클래스이며 Talend에 구축된 모든 것의 기본 실행 단위로 정의됩니다. Talend에서 사용할 수 있는 정보의 기능과 범위를 정의하기 위해 그래픽 표현을 사용합니다.

비즈니스의 요구 사항은 데이터 흐름을 구현하기 위해 코드, 프로그램 및 루틴으로 변환됩니다.

질문 5: '구성요소'를 설명하세요.

작업을 수행할 수 있는 Talend의 모든 기능 부분을 '구성 요소'라고 합니다. 표면적으로 구성 요소는 그래픽 표현입니다.

그러나 기술적인 측면에서 작업 실행 시 생성되는 Java 코드 조각은 우리가 구성 요소라고 부르는 것입니다. 작업이 저장될 때 Talend에 의해 컴파일됩니다.

질문 6: Talend에 존재하는 다양한 연결 유형은 무엇입니까?

Talend의 연결은 처리될 데이터 또는 작업 또는 데이터 출력의 시퀀스인 데이터를 나타냅니다.

Talend에서는 4가지 유형의 연결을 사용할 수 있습니다. 그들은

  1. 반복
  2. 방아쇠
  3. 링크

질문 7: Talend의 다양한 연결 유형을 설명하십시오.

행 : 이 연결은 데이터 흐름을 나타냅니다. 일부 행 연결은 조회, 다중 입력/출력 및 고유/중복입니다. 이 외에도 Filter, Output, Rejects, ErrorRejects도 행 연결입니다.

반복 : 반복 연결을 사용하여 파일 디렉토리, 행 또는 데이터베이스 항목의 파일에 대해 루프 기능을 수행할 수 있습니다.

Trigger : Trigger의 성격에 따른 순서대로 Trigger되는 Subjob과 Job 간의 의존성은 Trigger에 의해 생성된다.

Link : Link 연결을 이용하여 사용자가 테이블 스키마의 정보를 Talend의 ELT 매퍼로 전송할 수 있습니다.

질문 8: Talend의 트리거 유형은 무엇입니까?

트리거에는 두 가지 범주가 있습니다.

1. OnSubjobOK, OnSubjobError 및 Run if를 포함하는 하위 작업 트리거. OnSubjobOk는 이전 Subjob이 실행되면 실행됩니다.

2. OnComponentOK, OnComponentError 및 Run if를 포함하는 구성 요소 트리거. OnComponentOk는 이전 구성 요소가 실행되면 실행됩니다.

읽어보기: 빅 데이터를 관리하는 7가지 도구.

질문 9: Talend에서 지원하는 다양한 스키마 설명

Talend에서 지원하는 주요 스키마 유형은 다음과 같습니다.

  1. 리포지토리 스키마: 리포지토리 스키마는 여러 작업에서 재사용할 수 있습니다. 스키마에 대한 변경 사항은 모든 작업에 자동으로 반영됩니다.
  2. 일반 스키마: 일반 스키마는 다양한 유형의 데이터 소스 간에 공유 리소스로 작동합니다. 단일 데이터 소스에 연결되어 있지 않습니다.
  3. 고정 스키마: 읽기 전용입니다. 그것들은 Talend의 구성 요소 중 일부인 미리 정의된 체계입니다.

질문 10: 루틴이란 무엇입니까? 유형 설명

루틴은 재사용할 수 있는 Java 코드 조각입니다. 이를 통해 Java로 사용자 정의 코드를 작성할 수 있으며 이는 차례로 데이터 처리를 최적화하고 작업 용량을 향상시킵니다.

Talend에는 두 가지 유형의 루틴이 있습니다.

  1. 시스템 루틴: 시스템 루틴은 읽기 전용입니다. 그들은 직접 호출할 수 있습니다.
  2. 사용자 루틴: 사용자가 만든 사용자 정의 루틴입니다. 그것들은 완전히 새롭거나 기존 루틴의 적응입니다.

질문 11: 런타임에 스키마를 정의할 수 있습니까?

아니요, 런타임 중에는 스키마를 정의할 수 없습니다. 스키마는 데이터 이동을 의미하므로 구성 요소를 구성할 때 스키마를 정의해야 합니다.

질문 12: '저장소'와 '내장'의 차이점을 설명하십시오.

다음은 기본 제공과 저장소의 차이점입니다.

  1. Built-in에서는 데이터가 Repository 내에 중앙에서 저장되는 Repository와 달리 Job 내에 로컬로 데이터가 저장됩니다.
  2. 내장된 데이터는 로컬 작업만 사용할 수 있습니다. Repository의 경우 프로젝트 내의 모든 Job에서 사용할 수 있습니다.
  3. 데이터가 읽기 전용인 Repository와 달리 작업 내의 데이터에 액세스하여 기본 제공에서 업데이트를 수행할 수 있습니다.

질문 13: 컨텍스트 변수 정의

컨텍스트 변수는 작업이 런타임 중에 액세스할 수 있는 사용자가 정의한 매개변수입니다. 이러한 변수의 값은 작업이 개발 단계에서 테스트 및 생산 단계로 이동함에 따라 변경됩니다.

컨텍스트 변수를 정의하는 세 가지 방법이 있습니다.

  1. 포함된 컨텍스트 변수
  2. 리포지토리 컨텍스트 변수
  3. 외부 컨텍스트 변수

질문 14: Talend Open Studio에서 사용하는 '개요 보기'는 무엇입니까?

TOS의 개요 보기는 구성 요소에 포함된 반환 값을 추적하는 데 도움이 됩니다. tSetGlobal 컴포넌트에서 생성된 사용자 정의 값은 아웃라인 보기에 포함됩니다.

질문 15: tMap 구성요소란 무엇입니까? tMap 컴포넌트를 사용하여 수행할 수 있는 다양한 기능은 무엇입니까?

Talend의 tMap은 'Processing' 제품군의 핵심 구성 요소입니다. 입력을 출력 데이터에 매핑할 수 있습니다.

기능은 다음과 같습니다.

  1. 열을 추가하거나 제거할 수 있습니다.
  2. 변환 규칙은 모든 유형의 필드에 적용할 수 있습니다.
  3. 지정된 제약 조건을 사용하여 입력 데이터 및 출력 데이터를 필터링할 수 있습니다.
  4. 데이터를 거부할 수 있습니다.
  5. tMap 구성 요소를 사용하여 데이터를 다중화 또는 역다중화할 수 있습니다.
  6. 그것은 당신이 데이터를 연결할 수 있습니다
  7. 그것은 당신이 데이터를 교환 할 수 있습니다

질문 16: ETL 프로세스란 무엇입니까?

ETL은 추출, 변환 및 로드의 약자입니다. 소스에서 데이터를 검색하여 데이터 웨어하우스, 빅 데이터 시스템 또는 비즈니스 인텔리전스 플랫폼으로 이동하는 프로세스를 나타내는 데 사용됩니다.

추출: 다양한 유형의 스토리지 시스템 또는 데이터베이스에서 데이터를 검색하는 프로세스입니다. 여기에는 관계형 데이터베이스, Excel 파일, XML 파일 등이 포함될 수 있습니다.

변환: 이 단계에서는 스토리지 시스템에서 액세스한 데이터를 분석 및 작업을 거쳐 데이터 웨어하우징 시스템에 적합한 형식으로 데이터를 변환합니다.

로드: 리소스의 최적화된 사용을 통해 변환된 데이터가 최종적으로 저장소 또는 데이터 웨어하우스에 로드되는 곳입니다.

질문 17: "삽입 또는 업데이트"와 "업데이트 또는 삽입"의 차이점은 무엇입니까?

이 둘의 주요 차이점은 작업 순서입니다.

삽입 또는 업데이트: 여기에서 Talend는 레코드를 삽입하고 일치하는 기본 키가 존재하는 경우 레코드를 업데이트합니다.

업데이트 또는 삽입: 여기에서 Talend는 먼저 레코드 업데이트를 찾고 일치하는 기본 키를 찾습니다. 일치하는 기존 키를 찾지 못하면 레코드를 삽입합니다.

질문 18: 데이터 통합을 위한 TOS와 빅 데이터를 위한 TOS의 차이점은 무엇입니까?

TOS for Big Data는 다양한 Big Data 기술에 대한 지원을 제공하는 동시에 TOS for DI의 상위 집합 역할을 합니다. TOS for Data Integration의 모든 기능은 TOS Big Data에서 사용할 수 있습니다.

DI용 TOS는 Java 코드만 지원합니다. 반면 TOS for Big Data는 MapReduce 코드뿐만 아니라 Java 코드도 지원합니다.

질문 19: Talend가 지원하는 빅 데이터 기술의 이름은 무엇입니까?

Talend에서 지원하는 가장 많이 사용되는 빅 데이터 기술은 다음과 같습니다.

  • 카산드라
  • 카우치DB
  • 구글 스토리지
  • HBase
  • HDFS
  • 하이브
  • 맵RDB
  • 몽고DB
  • 돼지
  • 스쿱

질문 20: Pig에서 Pig 스크립팅에 어떤 언어가 사용됩니까?

돼지 라틴어

질문 21: Talend Studio와 HBase 간의 트랜잭션 조정을 가능하게 하는 필수 서비스는 무엇입니까?

사육사 서비스

질문 22: tContextLoad의 용도는 무엇입니까?

tContextLoad는 Talend의 '기타' 구성 요소의 일부입니다. tContextLoad를 사용하여 활성 컨텍스트에 있는 값을 수정할 수 있습니다. 데이터 흐름의 컨텍스트는 tContextLoad를 사용하여 로드됩니다.

입력에 정의된 매개변수가 컨텍스트에서 선언되지 않은 경우 tContextLoad는 경고 신호를 보냅니다.

또한 컨텍스트가 들어오는 데이터에서 초기화를 거치지 않은 경우 경고를 보냅니다.

결론

이것은 우리를 기사의 끝으로 이끕니다. 이러한 질문과 답변을 빠르게 정리하면 인터뷰를 푸는 데 도움이 될 것입니다.

Talend 제품은 IT 시장에서 엄청난 가능성을 지닌 차세대 도구로 선전되며 전 세계적으로 모든 규모의 기업이 선택하고 있습니다. 따라서 이 주문형 아키텍처는 IT 기술을 마스터하려는 모든 사람에게 권장됩니다. 위의 정보는 학습 여정을 시작하는 데 확실히 도움이 될 것입니다!

빅 데이터에 대해 더 알고 싶다면 PG 디플로마 빅 데이터 소프트웨어 개발 전문화 프로그램을 확인하십시오. 이 프로그램은 실무 전문가를 위해 설계되었으며 7개 이상의 사례 연구 및 프로젝트를 제공하고 14개 프로그래밍 언어 및 도구, 실용적인 실습을 다룹니다. 워크샵, 400시간 이상의 엄격한 학습 및 최고의 기업과의 취업 지원.

upGrad에서 다른 소프트웨어 엔지니어링 과정을 확인하십시오.

자신의 기술을 향상시키고 미래를 준비하십시오

400시간 이상의 학습. 14개 언어 및 도구. IIIT-B 동문 현황.
IIT Bangalore의 빅 데이터 고급 인증 프로그램