22 คำถามและคำตอบสัมภาษณ์ Talend ที่ถูกถามมากที่สุด [สำหรับ Freshers & ผู้มีประสบการณ์]

เผยแพร่แล้ว: 2021-01-21

เริ่มต้นด้วยความตั้งใจที่จะปรับปรุงการรวมข้อมูลให้ทันสมัย ​​Talend ได้เติบโตอย่างก้าวกระโดดที่จะกลายเป็น numero uno cloud และซอฟต์แวร์การรวมข้อมูลที่เลือกได้ในปัจจุบัน การรับรองใน Talend ถือเป็นทักษะที่มีมูลค่าสูงและบริษัทต่างๆ ในปัจจุบันกำลังมองหาการจ้างผู้เชี่ยวชาญของ Talend อย่างจริงจัง

ดังนั้น นี่อาจเป็นเวลาที่เหมาะสมในการเตรียมตัวและก้าวไปข้างหน้าในการแข่งขัน

ที่นี่ เราได้เลือกและรวบรวมคำถามและคำตอบในการสัมภาษณ์ Talend อันดับต้นๆ ที่สามารถช่วยให้คุณประสบความสำเร็จในการสัมภาษณ์ Talend และได้งานในฝันของคุณ

ตอนนี้ มาดูคำถามสัมภาษณ์ Talend ที่ถามบ่อยเหล่านี้กัน

คำถามและคำตอบในการสัมภาษณ์ผู้มีความสามารถสูงสุด

คำถามที่ 1: Talend คืออะไร?

Talend เป็นเครื่องมือโอเพ่นซอร์ส ETL (Extract, Transform Load) ที่ใช้สำหรับการรวมข้อมูล มีซอฟต์แวร์ที่แตกต่างกันเพื่อมอบโซลูชันสำหรับการจัดการข้อมูล การเตรียมข้อมูล ที่เก็บข้อมูลบนคลาวด์ บิ๊กดาต้า คุณภาพข้อมูล และการรวมแอปพลิเคชันระดับองค์กร

ช่วยให้บริษัทต่างๆ สามารถสื่อสารกันได้อย่างปลอดภัยในแบบเรียลไทม์ และทำการตัดสินใจโดยใช้ข้อมูลเป็นหลักเพื่อความยั่งยืนที่ยั่งยืน

คำถามที่ 2: ข้อดีของการใช้ Talend เหนือเครื่องมือ ETL อื่นๆ คืออะไร

  1. Talend เป็นเครื่องมือโอเพนซอร์ซ ซึ่งหมายความว่ามีการสนับสนุนจากชุมชนนักพัฒนาขนาดใหญ่
  2. งานของ Talend เป็นไปโดยอัตโนมัติและบำรุงรักษาอย่างราบรื่น ซึ่งทำให้การรวมข้อมูลเร็วขึ้น
  3. Talend เสนอสภาพแวดล้อมที่เป็นหนึ่งเดียวให้กับองค์กรเพื่อตอบสนองความต้องการของพวกเขา
  4. Talend เป็นซอฟต์แวร์รุ่นต่อไป ซึ่งหมายความว่ามันถูกสร้างมาเพื่อตอบสนองความต้องการในปัจจุบันและอนาคตของคุณ
  5. Talend เป็นแพลตฟอร์มบริการตนเองที่นำเสนอประสิทธิภาพและคุณภาพของข้อมูลสูง

คำถามที่ 3: อธิบาย 'โครงการ' ใน Talend?

'โครงการ' ได้รับการอธิบายว่าเป็นโครงสร้างทางกายภาพระดับบนสุดใน Talend ที่รับผิดชอบในการรวบรวมและจัดเก็บทรัพยากรทางเทคนิค แหล่งข้อมูลบางส่วนเหล่านี้ได้แก่:

  • โมเดลธุรกิจ
  • ข้อมูลเมตา
  • งาน
  • ตัวแปรบริบท
  • กิจวัตร

คำถามที่ 4: การออกแบบงานคืออะไร?

งานใน Talend เป็นคลาส Java เดียวในแง่ของเทคนิคและถูกกำหนดให้เป็นหน่วยปฏิบัติการพื้นฐานของทุกสิ่งที่สร้างขึ้นบน Talend ใช้การแสดงภาพกราฟิกเพื่อกำหนดการทำงานและขอบเขตของข้อมูลที่มีให้ Talend

ความต้องการของธุรกิจได้รับการแปลเป็นโค้ด โปรแกรม และกิจวัตรเพื่อนำกระแสข้อมูลไปใช้

คำถามที่ 5: อธิบาย 'ส่วนประกอบ'

ชิ้นส่วนที่ใช้งานได้ใน Talend ที่สามารถดำเนินการได้นั้นเรียกว่า 'ส่วนประกอบ' บนพื้นผิว ส่วนประกอบต่างๆ เป็นตัวแทนแบบกราฟิก

อย่างไรก็ตาม ในทางเทคนิคแล้ว ตัวอย่างโค้ด Java ที่สร้างขึ้นจากการทำงานของ Job คือสิ่งที่เราเรียกว่าส่วนประกอบ พวกเขาถูกรวบรวมโดย Talend และเมื่องานได้รับการบันทึก

คำถามที่ 6: การเชื่อมต่อประเภทต่าง ๆ ที่มีอยู่ใน Talend คืออะไร?

การเชื่อมต่อใน Talend แสดงถึงข้อมูลที่จะถูกประมวลผล หรือลำดับของงานหรือเอาท์พุตข้อมูล

มีการเชื่อมต่อสี่ประเภทใน Talend พวกเขาเป็น

  1. แถว
  2. ย้ำ
  3. สิ่งกระตุ้น
  4. ลิงค์

คำถามที่ 7: อธิบายการเชื่อมต่อประเภทต่างๆ ใน ​​Talend

แถว : การเชื่อมต่อนี้แสดงถึงการไหลของข้อมูล การเชื่อมต่อแถวบางแถว ได้แก่ Lookup, Multiple Input/Output และ Uniques/Duplicates นอกเหนือจากนี้ Filter, Output, Rejects, ErrorRejects ยังเป็นการเชื่อมต่อแถว

วน ซ้ำ : เมื่อใช้การเชื่อมต่อแบบวนซ้ำ คุณสามารถดำเนินการฟังก์ชันวนซ้ำกับไฟล์ในไดเร็กทอรีไฟล์ แถว หรือรายการฐานข้อมูล

ทริกเกอร์ : การพึ่งพาระหว่างงานย่อยและงานที่ทริกเกอร์ในลำดับตามลักษณะของทริกเกอร์นั้นทริกเกอร์สร้าง

ลิงค์ : เมื่อใช้การเชื่อมต่อแบบลิงค์ ผู้ใช้สามารถถ่ายโอนข้อมูลในตารางสคีมาไปยังตัวแมป ELT ใน Talend

คำถามที่ 8: ทริกเกอร์ใน Talend มีอะไรบ้าง

ทริกเกอร์มีสองประเภท:

1.Subjob Triggers ซึ่งรวมถึง OnSubjobOK, OnSubjobError และ Run if OnSubjobOk จะถูกดำเนินการเมื่องานย่อยก่อนหน้านี้ถูกดำเนินการแล้ว

2. ทริกเกอร์คอมโพเนนต์ซึ่งรวมถึง OnComponentOK, OnComponentError และ Run if OnComponentOk จะดำเนินการเมื่อคอมโพเนนต์ก่อนหน้านี้ได้รับการประมวลผลแล้ว

อ่านเพิ่มเติม: 7 เครื่องมือในการจัดการข้อมูลขนาดใหญ่

คำถามที่ 9: อธิบายรูปแบบต่างๆ ที่สนับสนุนโดย Talend

ประเภทสคีมาหลักที่ Talend รองรับ ได้แก่

  1. Repository Schema: Repository schema สามารถใช้ซ้ำได้หลายงาน การเปลี่ยนแปลงที่ทำกับสคีมาจะมีผลกับงานทั้งหมดโดยอัตโนมัติ
  2. คีมาทั่วไป: สคีมาทั่วไปทำหน้าที่เป็นทรัพยากรที่ใช้ร่วมกันระหว่างแหล่งข้อมูลประเภทต่างๆ ไม่ได้เชื่อมโยงกับแหล่งข้อมูลเดียว
  3. คีมาคงที่: สิ่งเหล่านี้เป็นแบบอ่านอย่างเดียว เป็นโครงร่างที่กำหนดไว้ล่วงหน้าซึ่งเป็นส่วนประกอบบางอย่างของ Talend

คำถามที่ 10: กิจวัตรคืออะไร? อธิบายประเภท

กิจวัตรคือส่วนต่างๆ ของโค้ด Java ที่นำกลับมาใช้ใหม่ได้ สิ่งเหล่านี้ช่วยให้คุณเขียนโค้ดที่กำหนดเองใน Java ซึ่งจะช่วยเพิ่มประสิทธิภาพการประมวลผลข้อมูลและปรับปรุงความสามารถในการทำงาน

มีกิจวัตรสองประเภทใน Talend:

  1. รูทีนของระบบ: รูทีนของระบบเป็นแบบอ่านอย่างเดียว พวกเขาสามารถเรียกได้โดยตรง
  2. รูทีนผู้ใช้: รูทีนเหล่านี้เป็นรูทีนแบบกำหนดเองที่สร้างโดยผู้ใช้ สิ่งเหล่านี้เป็นสิ่งใหม่ทั้งหมดหรือดัดแปลงจากกิจวัตรที่มีอยู่

คำถามที่ 11: สามารถกำหนด Schema ที่รันไทม์ได้หรือไม่

ไม่ได้ ไม่สามารถกำหนดสคีมาระหว่างรันไทม์ได้ เนื่องจากสคีมามีความหมายถึงการเคลื่อนที่ของข้อมูล ดังนั้น จึงควรกำหนดสคีมาเมื่อมีการกำหนดคอนฟิกส่วนประกอบ

คำถามที่ 12: ระบุความแตกต่างระหว่าง 'Repository' และ 'Built-in'?

ต่อไปนี้เป็นข้อแตกต่างระหว่าง Built-in และ Repository:

  1. ใน Built-in ข้อมูลจะถูกจัดเก็บไว้ใน Job แบบโลคัลซึ่งต่างจาก Repository ที่ข้อมูลถูกจัดเก็บไว้ใน Repository จากส่วนกลาง
  2. เฉพาะงานในพื้นที่เท่านั้นที่สามารถใช้ข้อมูลในตัว ในกรณีของ Repository งานใดๆ ภายในโปรเจ็กต์สามารถใช้ได้
  3. ข้อมูลภายในงานสามารถเข้าถึงได้เพื่อทำการอัปเดตในตัวซึ่งต่างจาก Repository ที่ข้อมูลเป็นแบบอ่านอย่างเดียว

คำถามที่ 13: กำหนดตัวแปรบริบท

ตัวแปรบริบทคือพารามิเตอร์ที่กำหนดโดยผู้ใช้ที่งานสามารถเข้าถึงได้ระหว่างรันไทม์ ค่าของตัวแปรเหล่านี้จะเปลี่ยนไปเมื่องานเปลี่ยนจากขั้นตอนการพัฒนาไปเป็นขั้นตอนการทดสอบและการผลิต

มีสามวิธีในการกำหนดตัวแปรบริบท:

  1. ตัวแปรบริบทที่ฝังตัว
  2. ตัวแปรบริบทของที่เก็บ
  3. ตัวแปรบริบทภายนอก

คำถามที่ 14: 'Outline View' ใช้สำหรับอะไรใน Talend Open Studio?

มุมมองเค้าร่างใน TOS ช่วยในการติดตามค่าส่งคืนที่มีอยู่ในส่วนประกอบ ค่าที่ผู้ใช้กำหนดเองซึ่งสร้างขึ้นในคอมโพเนนต์ tSetGlobal จะรวมอยู่ในมุมมองเค้าร่าง

คำถามที่ 15: ส่วนประกอบ tMap คืออะไร? ฟังก์ชันต่างๆ ที่สามารถทำได้โดยใช้คอมโพเนนต์ tMap มีอะไรบ้าง

tMap ใน Talend เป็นองค์ประกอบหลักของตระกูล 'กำลังดำเนินการ' ช่วยให้คุณสามารถแมปอินพุตกับข้อมูลเอาต์พุตได้

หน้าที่ของมันคือ:

  1. ช่วยให้คุณเพิ่มหรือลบคอลัมน์
  2. กฎการแปลงร่างใช้ได้กับสนามทุกประเภท
  3. ข้อมูลอินพุตและเอาต์พุตสามารถกรองได้โดยใช้ข้อจำกัดที่ระบุ
  4. ช่วยให้คุณสามารถปฏิเสธข้อมูล
  5. คุณสามารถมัลติเพล็กซ์หรือข้อมูลเดมัลติเพล็กซ์โดยใช้คอมโพเนนต์ tMap
  6. ช่วยให้คุณสามารถเชื่อมข้อมูล
  7. ช่วยให้คุณสามารถแลกเปลี่ยนข้อมูล

คำถามที่ 16: กระบวนการ ETL คืออะไร?

ETL ย่อมาจาก Extract, Transform และ Load ใช้เพื่อระบุกระบวนการดึงข้อมูลจากแหล่งที่มาและย้ายไปยังคลังข้อมูล ระบบ Big Data หรือแพลตฟอร์มข่าวกรองธุรกิจ

สารสกัด: นี่คือกระบวนการดึงข้อมูลจากระบบจัดเก็บข้อมูลหรือฐานข้อมูลประเภทต่างๆ ซึ่งอาจรวมถึงฐานข้อมูลเชิงสัมพันธ์ ไฟล์ excel ไฟล์ XML เป็นต้น

การแปลง: ในขั้นตอนนี้ ข้อมูลที่เข้าถึงได้จากระบบจัดเก็บข้อมูลจะได้รับการวิเคราะห์และดำเนินการเพื่อแปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมกับระบบคลังข้อมูล

โหลด: นี่คือที่ที่ข้อมูลที่แปลงแล้วจะถูกโหลดในที่สุดไปยังที่เก็บหรือคลังข้อมูลผ่านการใช้ทรัพยากรที่เหมาะสมที่สุด

คำถามที่ 17: อะไรคือความแตกต่างระหว่าง "แทรกหรืออัปเดต" และ "อัปเดตหรือแทรก"

ความแตกต่างหลักระหว่างทั้งสองคือลำดับของการกระทำ:

แทรกหรืออัปเดต: ที่นี่ Talend พยายามแทรกเรกคอร์ดและอัปเดตหากพบคีย์หลักที่ตรงกันที่มีอยู่

อัปเดตหรือแทรก: ที่นี่ Talend พยายามอัปเดตระเบียนก่อนและค้นหาคีย์หลักที่ตรงกัน ถ้าไม่พบคีย์ที่ตรงกันที่มีอยู่ มันจะแทรกเรกคอร์ด

คำถามที่ 18: อะไรคือความแตกต่างระหว่าง TOS สำหรับการผสานข้อมูลและ TOS สำหรับ Big Data

TOS สำหรับ Big Data ให้การสนับสนุนเทคโนโลยี Big Data ต่างๆ ในขณะที่ทำหน้าที่เป็น superset ของ TOS สำหรับ DI ฟังก์ชันทั้งหมดของ TOS สำหรับการผสานข้อมูลมีอยู่ใน TOS Big Data

TOS สำหรับ DI รองรับโค้ด Java เท่านั้น ในทางกลับกัน TOS สำหรับ Big Data รองรับโค้ด Java เช่นเดียวกับโค้ด MapReduce

คำถามที่ 19: ตั้งชื่อ Big Data Technologies ที่สนับสนุนโดย Talend ?

เทคโนโลยี Big Data ที่ใช้มากที่สุดบางส่วนที่สนับสนุนโดย Talend ได้แก่:

  • แคสแซนดรา
  • CouchDB
  • Google Storage
  • HBase
  • HDFS
  • ไฮฟ์
  • แผนที่RDB
  • MongoDB
  • หมู
  • Sqoop

คำถามที่ 20: ภาษาใดที่ใช้สำหรับ Pig Scripting ใน Pig ?

หมูละติน

คำถามที่ 21: บริการบังคับใดที่ช่วยให้สามารถประสานงานธุรกรรมระหว่าง Talend Studio และ HBase ได้

บริการผู้ดูแลสวนสัตว์

คำถามที่ 22: การใช้ tContextLoad คืออะไร?

tContextLoad เป็นส่วนหนึ่งของส่วนประกอบ 'เบ็ดเตล็ด' ของ Talend เมื่อใช้ tContextLoad คุณสามารถแก้ไขค่าที่มีอยู่ในบริบทที่ใช้งานอยู่ได้ บริบทจากโฟลว์ข้อมูลถูกโหลดโดยใช้ tContextLoad

เมื่อพารามิเตอร์ที่กำหนดในอินพุตไม่ได้รับการประกาศในบริบท tContextLoad จะส่งสัญญาณเตือน

นอกจากนี้ยังส่งคำเตือนหากบริบทไม่ได้รับการกำหนดค่าเริ่มต้นในข้อมูลขาเข้า

บทสรุป

สิ่งนี้นำเราไปสู่จุดสิ้นสุดของบทความของเรา เราหวังว่าการสรุปคำถามและคำตอบเหล่านี้อย่างรวดเร็วจะช่วยคุณในการสัมภาษณ์

ผลิตภัณฑ์ Talend ได้รับการขนานนามว่าเป็นเครื่องมือแห่งอนาคตที่มีคำมั่นสัญญาอย่างมากในตลาดไอที โดยได้รับเลือกจากบริษัททุกขนาดทั่วโลก ดังนั้นสถาปัตยกรรมตามความต้องการนี้จึงเหมาะสำหรับทุกคนที่ต้องการเชี่ยวชาญด้านเทคโนโลยีไอที ข้อมูลข้างต้นจะช่วยให้คุณเริ่มต้นเส้นทางการเรียนรู้ได้อย่างแน่นอน!

หากคุณสนใจที่จะทราบข้อมูลเพิ่มเติมเกี่ยวกับ Big Data โปรดดูที่ PG Diploma in Software Development Specialization in Big Data program ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีกรณีศึกษาและโครงการมากกว่า 7 กรณี ครอบคลุมภาษาและเครื่องมือในการเขียนโปรแกรม 14 รายการ เวิร์กช็อป ความช่วยเหลือด้านการเรียนรู้และจัดหางานอย่างเข้มงวดมากกว่า 400 ชั่วโมงกับบริษัทชั้นนำ

ตรวจสอบหลักสูตรวิศวกรรมซอฟต์แวร์อื่นๆ ของเราที่ upGrad

พัฒนาตัวเองและเตรียมพร้อมสำหรับอนาคต

การเรียนรู้มากกว่า 400 ชั่วโมง 14 ภาษาและเครื่องมือ สถานะศิษย์เก่า IIIT-B
โปรแกรมประกาศนียบัตรขั้นสูงด้าน Big Data จาก IIIT Bangalore