24 Datastage Mülakat Sorusunu ve Yanıtını Okumalısınız [Ultimate Guide 2022]

Yayınlanan: 2021-01-08

Datastage, IBM tarafından InfoSphere paketinde ve Information Solutions Platforms paketinde sağlanan bir ETL yani Ayıklama, Dönüştürme ve Yükleme aracıdır. Popüler bir ETL aracıdır ve veri havuzlarını oluşturmak ve sürdürmek için büyük veri kümeleri ve ambarlarla çalışmak için kullanılır. Bu yazımızda en sık sorulan DataStage mülakat sorularına bakacağız ve bu soruların cevaplarını da vereceğiz. Yeni başlayan biriyseniz ve veri bilimi hakkında daha fazla bilgi edinmek istiyorsanız, en iyi üniversitelerden veri bilimi eğitimimize göz atın.

En yaygın DataStage mülakat soruları ve cevapları aşağıdaki gibidir:

İçindekiler

DataStage Mülakat Soruları ve Cevapları

1. IBM DataStage nedir ve neden kullanılır?

DataStage, IBM tarafından sağlanan ve Windows sunucularından veritabanlarından verileri ayıklayarak verileri veri ambarlarına dolduracak uygulamaları tasarlamak, geliştirmek ve yürütmek için kullanılan bir araçtır. Veri entegrasyonları için grafik görselleştirme özelliği içerir ve ayrıca birden fazla kaynaktan veri ayıklayabilir. Bu nedenle en güçlü ETL araçlarından biri olarak kabul edilir. DataStage, şirketlerin ihtiyaçlarına göre kullanabilecekleri çeşitli versiyonlara sahiptir. Sürümler Sunucu Sürümü, MVS Sürümü ve Enterprise Sürümüdür.

2. DataStage'in özellikleri nelerdir?

IBM DataStage'in özellikleri aşağıdaki gibidir:

  • İhtiyaç ve gereksinime göre bulutun yanı sıra yerel sunuculara da dağıtılabilir.
  • Kullanımı zahmetsizdir ve veri entegrasyonunun hızını ve esnekliğini verimli bir şekilde artırabilir.
  • Büyük verileri destekler ve büyük verilere JDBC entegratörü, JSON desteği ve dağıtılmış dosya sistemleri gibi birçok yoldan erişebilir.

3. DataStage mimarisini kısaca tanımlayın.

IBM DataStage, mimarisi olarak bir istemci-sunucu modelini takip eder ve çeşitli sürümleri için farklı mimari türlerine sahiptir. İstemci-sunucu mimarisinin bileşenleri şunlardır:

    1. İstemci bileşenleri
    2. sunucular
    3. Aşamalar
    4. Tablo tanımları
    5. Konteynerler
    6. Projeler
    7. Meslekler

4. DataStage'deki komut satırını kullanarak bir işi nasıl çalıştırabiliriz?

Komut şudur: dsjob -run -jobstatus <projectname> <jobname>

5. 'dsjob' komutunu kullanarak yürütebileceğimiz birkaç işlevi listeleyin.

$dsjob komutunu kullanarak gerçekleştirebileceğimiz farklı işlevler şunlardır:

    1. $dsjob -run: DataStage işini çalıştırmak için kullanılır
    2. $dsjob -stop: Süreçte mevcut olan işi durdurmak için kullanılır.
    3. $dsjob -jobid: İş bilgilerini sağlamak için kullanılır.
    4. $dsjob -report: İş raporunun tamamını görüntülemek için kullanılır.
    5. $dsjob -lprojects: Mevcut tüm projeleri listelemek için kullanılır.
    6. $dsjob -ljobs: Projede bulunan tüm işleri listelemek için kullanılır.
    7. $dsjob -lstages: Mevcut işin tüm aşamalarını listelemek için kullanılır.
    8. $dsjob -lllinks: Tüm linkleri listelemek için kullanılır.
    9. $dsjobs -lparams: İşin tüm parametrelerini listelemek için kullanılır.
    10. $dsjob -projectinfo: Proje ile ilgili bilgileri almak için kullanılır.
    11. $dsjob -jobinfo: İşin bilgi alımı için kullanılır.
    12. $dsjob -stageinfo: İşin o aşamasının bilgi almak için kullanılır.
    13. $dsjob -linkinfo: O linkin bilgilerini almak için kullanılır.
    14. $dsjob -paraminfo: Tüm parametrelerin bilgilerini sağlar.
    15. $dsjob -loginfo: Log hakkında bilgi almak için kullanılır.
    16. $dsjob -log: Günlüğe bir metin mesajı eklemek için kullanılır
    17. $dsjob -logsum: Günlük verilerini görüntülemek için kullanılır
    18. $dsjob -logdetail: Günlüğün tüm detaylarını görüntülemek için kullanılır.
    19. $dsjob -lognewest: En yeni günlüğün kimliğini almak için kullanılır

6. IBM DataStage'de akış tasarımcısı nedir?

Akış tasarımcısı, DataStage'in web tabanlı kullanıcı arabirimidir ve DataStage'de işleri oluşturmak, düzenlemek, yüklemek ve çalıştırmak için kullanılır.

Kaynak

7. Akış tasarımcısının temel özellikleri nelerdir?

Akış tasarımcısının ana özellikleri şunlardır:

  1. Çok sayıda aşaması olan işleri gerçekleştirmek çok faydalıdır.
  2. Akış tasarımcısını kullanmak için işleri taşımaya gerek yoktur.
  3. Sürükle ve bırak özelliğini kullanarak tasarımcı tuvaline bağlayıcılar ve operatörler eklemek ve kaldırmak için sağlanan paleti kullanabiliriz.

Şu konularda bilgi edinin: Veri Bilimi ve Veri Madenciliği: Veri Bilimi ve Veri Madenciliği Arasındaki Fark

8. DataStage'de bir sunucu işi paralel bir işe nasıl dönüştürülür?

Bir sunucu işi, bir Bağlantı toplayıcı ve bir IPC toplayıcı kullanılarak paralel bir işe dönüştürülebilir.

9 . HBase konektörü nedir?

DataStage'deki bir HBase bağlayıcısı, HBase veritabanında bulunan veritabanlarını ve tabloları bağlamak için kullanılan bir araçtır. Büyük ölçüde aşağıdaki görevleri gerçekleştirmek için kullanılır:

  1. HBase veritabanından veri okuyun ve veri yazın.
  2. Paralel modda veri okuma.
  3. HBase'i bir görünüm tablosu olarak kullanma

10. Hive bağlayıcı nedir?

Hive bağlayıcı, verileri okurken bölümleme modlarını desteklemek için kullanılan bir araçtır. İki şekilde yapılabilir:

  1. modül bölme modu
  2. minimum-maksimum bölüm modu

11. DataStage'de Infoosphere nedir?

Infoosphere bilgi sunucusu, şirketlerin yüksek hacimli gereksinimlerini yönetebilir ve yüksek kaliteli ve daha hızlı sonuçlar verir. Şirketlere, muazzam miktarda bilgiyi anlayabilecekleri, temizleyebilecekleri, dönüştürebilecekleri ve sunabilecekleri verileri yönetmek için tek bir platform sağlar.

Kaynak

12. InfoSphere Information Server'ın tüm farklı katmanları listelensin mi?

InfoSphere Information Server'ın farklı katmanları şunlardır:

  1. Müşteri katmanı
  2. Hizmetler katmanı
  3. Motor katmanı
  4. Meta Veri Deposu katmanı

13. Infoosphere Information Server'ın İstemci katmanını kısaca tanımlayın.

Infosphere Information Server'ın istemci katmanı, istemci programları ve konsolları kullanan bilgisayarların geliştirilmesi ve eksiksiz yönetimi için kullanılır.

14. Infoosphere Information Server'ın Hizmetler katmanını kısaca tanımlayın.

Infoosphere Information Server'ın hizmet katmanı, meta veriler ve günlük kaydı ve diğer bazı modüle özgü hizmetler gibi standart hizmetleri sağlamak için kullanılır. Bir uygulama sunucusunu, çeşitli ürün modüllerini ve diğer ürün hizmetlerini içerir.

15. Infoosphere Information Server'ın Motor katmanını kısaca tanımlayın.

Infosphere Information Server'ın motor katmanı, ürün modülleri için işleri ve diğer görevleri çalıştırmak için kullanılan bir dizi mantıksal bileşendir.

16. Infoosphere Information Server'ın Metadata Repository katmanını kısaca tanımlayın.

Infoosphere Information Server'ın meta veri havuzu katmanı, meta veri havuzunu, analiz veritabanını ve bilgisayarı içerir. Meta verileri, paylaşılan verileri ve yapılandırma bilgilerini paylaşmak için kullanılır.

17. DataStage'deki paralel işleme türleri nelerdir?

İki farklı paralel işleme türü vardır:

  1. Veri Bölümleme
  2. Veri İşleme

18 . Veri Bölümleme nedir?

Veri bölümleme, veri işleme için bir tür paralel yaklaşımdır. İşleme için kayıtları bölümlere ayırma sürecini içerir. Doğrusal bir modelde işleme verimliliğini artırır.

Devamını okuyun: Makine Öğreniminde Veri Ön İşleme: İzlenecek 7 Kolay Adım

19. Veri Boru Hattı Nedir?

Veri İşleme, kaynaktan veri çıkarma işlemini gerçekleştirdiğimiz ve ardından gerekli çıktıyı elde etmek için bir dizi işleme işlevinden geçirmelerini sağladığımız veri işleme için bir tür paralel yaklaşımdır.

20. DataStage'de OSH nedir?

OSH, Orchestrate Shell'in kısaltmasıdır ve DataStage'de paralel motor tarafından dahili olarak kullanılan bir betik dilidir.

21. Oyuncular nedir?

DataStage'deki oyuncular, beygir süreçleridir. Paralel işlemeyi gerçekleştirmemize yardımcı olurlar ve her düğümdeki operatörlere atanırlar.

22. DataStage'deki koleksiyon kitaplığı nedir?

Koleksiyon kitaplıkları, operatörler kümesidir ve bölümlenmiş verileri toplamak için kullanılır.

23. DataStage'in koleksiyon kitaplığında bulunan toplayıcı türleri nelerdir?

Koleksiyon kitaplığında bulunan koleksiyoner türleri şunlardır:

  1. sıralama toplayıcı
  2. döngüsel toplayıcı
  3. sipariş toplayıcı

24. Kaynak dosya DataStage'de nasıl doldurulur?

Kaynak dosya, SQL sorguları kullanılarak ve ayrıca satır oluşturucu çıkarma aracı kullanılarak doldurulabilir.

Sonuç olarak

Tüm DataStage mülakat sorularını ve cevaplarını içeren makalemizin DataStage Mülakatına hazırlanmanıza yardımcı olacağını umuyoruz. Bu konularda bilginizi artırmak için upGrad tarafından sunulan bu kurslara göz atabilirsiniz:

  1. Yazılım Geliştirmede PG Diploması Büyük Veride Uzmanlaşma : Bu kurs, upGrad tarafından IIIT-B ile birlikte bireylere yazılım geliştirme için ihtiyaç duydukları bilgileri sağlamak ve Büyük Veri yönetimi hakkındaki bilgileri kapsamak üzere oluşturulmuştur.
  2. Tam Yığın Geliştirmede PGC : Tam yığın geliştirmeyle ilgili bu kurs, bireyleri endüstri düzeyindeki zorlukları çözebilecek ve endüstrilere girmek ve bu endüstrilerde çalışmak için gereken tüm becerileri kazanabilecek yeterlilikte kılmak için Tech Mahindra'dan upGrad ve endüstri profesyonelleri tarafından oluşturulur.

upGrad olarak hazırlıklarınızda size yardımcı olmak için her zaman yanınızdayız. Her zaman 'Raho Hırslı' dediğimiz gibi, mülakatlarınıza ve gelecekteki iş hedeflerinize iyi hazırlanmak için endüstrinin gerektirdiği tüm beceri ve teknikleri öğrenmenize yardımcı olabilecek kurslarımıza da bakabilirsiniz. Bu kurslar, öğrenmek istediğiniz teknoloji ve becerilerde yetkin olmanızı sağlamak için endüstri uzmanları ve deneyimli akademisyenler tarafından yapılmıştır.

Python öğrenmekle ilgileniyorsanız ve çeşitli araçlar ve kütüphaneler konusunda ellerinizi kirletmek istiyorsanız, Veri Biliminde Yönetici PG Programına göz atın.

Datastage'in dört ana aşaması nelerdir?

IBM Datastage, verileri veritabanlarından ayıklayarak verileri veri ambarlarına dolduracak uygulamaları tasarlamak, geliştirmek ve yürütmek için güçlü bir araçtır. Aşağıda Datastage'in dört ana aşaması bulunmaktadır. Yönetici, DataStage kullanıcılarının ve temizleme kriterlerinin ayarlanması, projelerin mobilize edilmesi ve demobilize edilmesi vb. gibi yönetim görevleri için kullanılır. Tasarımcı veya tasarım arayüzü, Datastage uygulamalarını VEYA direktör tarafından düzenlenen ve sunucu tarafından yürütülen işleri geliştirir. Adından da anlaşılacağı gibi, yönetici depoları korur ve yönetir ve kullanıcıların depolanan verileri bunun aracılığıyla değiştirmesine izin verir. Yönetici, paralel işleri izlemenin yanı sıra işleri doğrulama, zamanlama ve yürütme gibi çeşitli işlevleri yerine getirir.

“dsjob” komutu hangi amaçlarla kullanılır?

dsjob komutu, projeler veya işler hakkındaki verilerin alınması ve görüntülenmesi dahil olmak üzere çeşitli işlevler için kullanılır. Burada, dsjob komutu kullanılarak yürütülebilecek işlevlerden bazıları verilmiştir. $dsjob -DataStage işini çalıştırmak için kullanılır, $dsjob -stop işlemde mevcut olan işi durdurmak için kullanılır, $dsjob -jobid iş bilgilerini sağlamak için kullanılır, $dsjob -rapor tüm iş raporunu görüntülemek için kullanılır , vb.

DataStage'in özellikleri nelerdir?

Datastage, güçlü bir veri mimarisi aracıdır ve çeşitli özelliklere sahiptir. Datastage'in bazı özellikleri aşağıdaki gibidir: Datastage, kullanıcının gereksinimlerine bağlı olarak yerel sunucular ve bulut sunucuları üzerinde konuşlandırılabilir. Veri entegrasyonunun hızı ve esnekliği her an artırılabilir ve verimli bir şekilde kullanılabilir. Büyük verileri destekler ve büyük verilere JDBC entegratörü, JSON desteği ve dağıtılmış dosya sistemleri gibi birçok yolla erişebilir.