22 個最常被問到的 Talend 面試問題和答案 [針對應屆生和有經驗者]
已發表: 2021-01-21Talend 的初衷是實現數據集成的現代化,現已實現跨越式發展,成為當今首選的 numero uno 雲和數據集成軟件。 Talend 認證被認為是一項非常有價值的技能,如今的公司正在積極尋求聘請 Talend 專業人員。
因此,這可能正是讓自己做好準備並在競爭中領先的正確時機。
在這裡,我們選擇並整理了 Talend 面試的熱門問題和答案,可以幫助您在 Talend 面試中取得好成績並找到您夢寐以求的工作。
現在,讓我們看看這些常見的 Talend 面試問題。
頂級 Talend 面試問題和答案
問題 1:什麼是 Talend?
Talend 是用於數據集成的開源 ETL(提取、轉換加載)工具。 它擁有不同的軟件,為數據管理、數據準備、雲存儲、大數據、數據質量和企業應用集成提供解決方案。

它使公司能夠實時安全地相互通信,並採取數據驅動的決策以實現持久的可持續性。
問題 2:與其他 ETL 工具相比,使用 Talend 的優勢是什麼?
- Talend 是一個開源工具,這意味著它得到了一個大型開發者社區的支持。
- Talend 任務是自動化和無縫維護的,這使得數據集成更快。
- Talend 為組織提供統一的環境來滿足他們的需求。
- Talend 是下一代軟件,這意味著它的創建是為了滿足您當前和未來的需求。
- Talend 是一個提供本機性能和高數據質量的自助服務平台。
問題 3:在 Talend 中描述一個“項目”?
“項目”被描述為 Talend 中負責編譯和存儲技術資源的最頂層物理結構。 其中一些資源包括:
- 商業模式
- 元數據
- 工作
- 上下文變量
- 例程
問題 4:什麼是工作設計?
Talend 中的 Job 在技術術語中是單個 Java 類,被定義為在 Talend 上構建的任何東西的基本可執行單元。 它使用圖形表示來定義 Talend 可用信息的功能和範圍。
業務需求被轉化為代碼、程序和例程來實現數據流。
問題 5:描述一個“組件”。
Talend 中任何可以執行操作的功能部件都稱為“組件”。 從表面上看,組件是圖形表示。
但是,從技術上講,在執行 Job 時生成的 Java 代碼片段就是我們所說的組件。 它們由 Talend 在保存作業時編譯。
問題 6:Talend 中存在哪些不同類型的連接?
Talend 中的連接表示將被處理的數據,或者是作業或數據輸出的序列。
Talend 中有四種類型的連接可用。 他們是
- 排
- 迭代
- 扳機
- 關聯
問題 7:解釋 Talend 中的各種連接類型。
Row :此連接代表數據流。 一些行連接是查找、多輸入/輸出和唯一/重複。 除此之外,Filter、Output、Rejects、ErrorRejects 也是行連接。
迭代:使用迭代連接,您可以對文件目錄、行或數據庫條目中的文件執行循環功能。
觸發器:子作業和按觸發器性質按順序觸發的作業之間的依賴關係是由觸發器創建的。
Link :使用 Link 連接,用戶可以將表模式中的信息傳輸到 Talend 中的 ELT 映射器
問題 8:Talend 中的觸發器有哪些類型?
觸發器分為兩類:
1.Subjob 觸發器,包括 OnSubjobOK、OnSubjobError 和 Run if。 OnSubjobOk 在前一個 Subjob 執行後執行。
2.組件觸發器,包括OnComponentOK、OnComponentError和Run if。 OnComponentOk 在前一個組件執行後執行。
另請閱讀:管理大數據的 7 個工具。
問題 9:解釋 Talend 支持的不同模式
Talend 支持的主要模式類型有:
- 存儲庫模式:存儲庫模式可由多個作業重用。 對架構所做的更改會自動反映在所有作業中。
- 通用模式:通用模式作為不同類型數據源之間的共享資源。 它不依賴於單個數據源。
- 固定架構:這些是只讀的。 它們是預定義的方案,是 Talend 的一些組件。
問題 10:什麼是例程? 解釋它的類型
例程是可以重用的 Java 代碼片段。 它們允許您用 Java 編寫自定義代碼,從而有助於優化數據處理並提高作業容量。
Talend 中有兩種類型的例程:
- 系統例程:系統例程是只讀的。 可以直接調用它們。
- 用戶例程:這些是用戶創建的自定義例程。 它們要么是全新的,要么是對現有例程的改編。
問題 11:Schema 可以在運行時定義嗎?
不,無法在運行時定義模式。 這是因為模式表示數據移動,因此應該在配置組件時定義它們。
問題 12:說明“存儲庫”和“內置”之間的區別?
以下是內置和存儲庫之間的區別:
- 在 Built-in 中,數據存儲在本地的 Job 中,而 Repository 中的數據集中存儲在 Repository 中。
- 只有本地 Job 才能使用 Built-in 中的數據。 對於 Repository,Project 中的任何 Job 都可以使用它。
- 與數據是只讀的存儲庫不同,可以訪問作業中的數據以在內置中進行更新。
問題 13:定義上下文變量

上下文變量是作業在運行時可以訪問的用戶定義的參數。 隨著作業從開發階段進入測試和生產階段,這些變量的值會發生變化。
定義上下文變量的三種方法:
- 嵌入式上下文變量
- 存儲庫上下文變量
- 外部上下文變量
問題 14:Talend Open Studio 中的“大綱視圖”是做什麼用的?
TOS 中的大綱視圖有助於跟踪組件中包含的返回值。 在 tSetGlobal 組件中創建的用戶定義值包含在大綱視圖中。
問題 15:什麼是 tMap 組件? 使用 tMap 組件可以執行哪些各種功能?
Talend 中的 tMap 是“處理”系列的核心組件。 它允許您將輸入映射到輸出數據。
它的功能是:
- 它允許您添加或刪除列
- 轉換規則可以應用於任何類型的字段
- 可以使用指定的約束過濾輸入數據和輸出數據
- 它允許您拒絕數據
- 您可以使用 tMap 組件復用或解復用數據
- 它允許您連接數據
- 它允許您交換數據
問題 16:什麼是 ETL 流程?
ETL 是提取、轉換和加載的縮寫。 它用於指示從源檢索數據並將其移動到數據倉庫、大數據系統或商業智能平台的過程。
提取:這是從不同類型的存儲系統或數據庫中檢索數據的過程。 這可能包括關係數據庫、excel 文件、XML 文件等。
轉換:在此步驟中,從存儲系統訪問的數據經過分析和操作,將數據轉換為適合數據倉庫系統的格式。
加載:這是通過優化資源使用最終將轉換後的數據加載到存儲庫或數據倉庫的地方。
問題 17:“插入或更新”和“更新或插入”有什麼區別
兩者之間的主要區別在於操作的順序:
插入或更新:在這裡,Talend 試圖插入一條記錄,如果發現存在匹配的主鍵,則對其進行更新。
更新或插入:在這裡,Talend 首先尋求更新記錄並尋找匹配的主鍵。 如果它沒有找到現有的匹配鍵,則插入記錄。
問題18:數據集成的TOS和大數據的TOS有什麼區別
TOS for Big Data 為各種大數據技術提供支持,同時作為 TOS for DI 的超集。 TOS 數據集成的所有功能都可用於 TOS 大數據。
TOS for DI 僅支持 Java 代碼。 另一方面,大數據 TOS 支持 Java 代碼以及 MapReduce 代碼。
問題 19:命名 Talend 支持的大數據技術?
Talend 支持的一些最常用的大數據技術包括:
- 卡桑德拉
- 沙發數據庫
- 谷歌存儲
- HBase
- 高密度文件系統
- 蜂巢
- 地圖數據庫
- MongoDB
- 豬
- Sqoop
問題 20:Pig 中的 Pig 腳本使用哪種語言?
豬拉丁語
問題 21:哪個是支持 Talend Studio 和 HBase 之間的事務協調的強制性服務?
動物園管理員服務
問題22:tContextLoad有什麼用?
tContextLoad 是 Talend 的“雜項”組件的一部分。 使用 tContextLoad,您可以修改活動上下文中存在的值。 使用 tContextLoad 加載來自數據流的上下文。
當輸入中定義的參數尚未在上下文中聲明時,tContextLoad 會發送警告信號。

如果上下文未在傳入數據中進行初始化,它還會發送警告。
結論
這將我們帶到了文章的結尾。 我們希望這些問題和答案的快速復習能幫助您完成面試。
Talend 產品被吹捧為在 IT 市場上具有巨大潛力的下一代工具,被全球各種規模的公司所選擇。 因此,建議任何想要掌握 IT 技術的人使用這種按需架構。 以上信息一定會幫助您開始您的學習之旅!
如果您有興趣了解有關大數據的更多信息,請查看我們的 PG 大數據軟件開發專業文憑課程,該課程專為在職專業人士設計,提供 7 多個案例研究和項目,涵蓋 14 種編程語言和工具,實用的動手操作研討會,超過 400 小時的嚴格學習和頂級公司的就業幫助。
在 upGrad 查看我們的其他軟件工程課程。