top 32 best datastage interview questions
En Sık Sorulan Datastage Görüşme Sorularının Listesi ve Yaklaşan Görüşmeye Hazırlanmanıza Yardımcı Olacak Cevaplar:
DataStage, mevcut pazarda bulunan çok popüler bir ETL aracıdır.
Bu makalede, IBM Datastage görüşmeleri için tasarlanmış çok faydalı bir dizi soru-yanıtı paylaşıyorum. Aşağıdaki Datastage mülakat sorularının üzerinden geçmek, mülakatı kırmanızı kolaylaştırabilir.
Yeni başlayanlara ve deneyimli profesyonellere yardımcı olacak Datastage Mülakat Sorularına ayrıntılı yanıtlar verdik.
Önerilen okuma => ETL testi mülakat soruları
En Yaygın Datastage Görüşme Soruları ve Cevapları
Hadi başlayalım!
S # 1) Datastage nedir?
Yanıtlar: Datastage bir ETL aracı veren IBM Veri entegrasyon çözümlerini tasarlamak için bir GUI kullanan. Bu, paralellik kavramı veren ilk ETL aracıdır.
Aşağıdaki 3 farklı sürümde mevcuttur
- Sunucu Sürümü
- Kurumsal Sürüm
- MVS Sürümü
S # 2) Datastage'ın temel özelliklerini vurguluyor musunuz?
Yanıtlar: Datastage'ın temel özellikleri aşağıda vurgulanmıştır:
- IBM Infosphere bilgi sunucusunun veri bütünleştirme bileşenidir.
- GUI tabanlı bir araçtır. Sadece Datastage nesnelerini sürükleyip bırakmamız gerekiyor ve bunu Datastage koduna dönüştürebiliriz.
- ETL işlemlerini (Çıkart, Dönüştür, Yükle) gerçekleştirmek için kullanılır.
- Aynı anda birden fazla kaynağa ve birden çok hedefe bağlantı sağlar
- Datastage işlerinin çok büyük hacimli verileri çok daha hızlı işlemesini sağlayan bölümleme ve paralel işleme teknikleri sağlar.
- Kurumsal düzeyde bağlantıya sahiptir.
S # 3) Datastage aracının birincil kullanımları nelerdir?
Yanıtlar: Datastage, öncelikle kaynak sistemlerden veri çıkarmak, bu verileri dönüştürmek ve son olarak hedef sistemlere yüklemek için kullanılan bir ETL aracıdır.
S # 4) DataStage'in 7.x ve 8.x sürümleri arasında gözlemlediğiniz temel farklılıklar nelerdir?
Yanıtlar: Buraya her iki sürüm arasındaki temel farklar
7.x | 8.x |
---|---|
7.x sürümü platforma bağlıydı | Bu sürüm platformdan bağımsızdır |
Datastage'ın Unix sunucusu üzerine inşa edildiği 2 katmanlı mimariye sahiptir. | Altta UNIX sunucu veritabanımızın olduğu 3 katmanlı mimariye, ardından depo görevi gören XMETA veritabanına ve üstte datastage'a sahip olduğumuz yer. |
Parametre seti kavramı yoktur | Projenin herhangi bir yerinde kullanılabilecek parametre setlerimiz var. |
İki ayrı müşteri olarak tasarımcı ve yöneticimiz vardı | Bu versiyonda, yönetici müşteri tasarımcı istemciye birleştirildi |
Bu sürümdeki işleri manuel olarak aramak zorunda kaldık | Burada arşivde işleri kolayca arayabileceğimiz hızlı bulma seçeneğimiz var. |
S # 5) IBM Infosphere bilgi sunucusunun ana özelliklerini vurgulayabilir misiniz?
Yanıtlar: IBM Infosphere bilgi sunucusu paketinin ana özellikleri şunlardır:
sql mülakat sorularım ve cevaplarım
- Veri entegrasyonu için tek bir platform sağlar. Birden çok kaynak sisteme bağlanma ve birden çok hedef sisteme yazma yeteneğine sahiptir.
- Merkezi katmanlara dayanmaktadır. Paketin tüm bileşenleri, paketin temel mimarisini paylaşabilir.
- Entegre meta veri hizmetleri ve ortak bir paralel motor için birleşik havuz için katmanlara sahiptir.
- Verilerin analizi, temizlenmesi, izlenmesi, dönüştürülmesi ve iletilmesi için araçlar sağlar.
- Büyük ölçüde paralel işleme yeteneklerine sahiptir. İşlemin çok hızlı olduğu ortaya çıkıyor.
S # 6) Bilgi sunucusu mimarisindeki farklı katmanlar nelerdir?
Yanıtlar: Aşağıda farklı bilgi sunucusu mimarisi katmanları verilmiştir
- Birleşik kullanıcı arayüzü
- Ortak hizmetler
- Birleşik paralel işleme
- Birleşik Meta Veriler
- Ortak bağlantı
S # 7) Bir veri kaynağı sistemi ne olabilir?
Yanıtlar: Bir veritabanı tablosu, düz bir dosya veya hatta insanlar gibi harici bir uygulama olabilir.
S # 8) Geliştirici olarak hangi arayüzde çalışacaksınız?
Yanıtlar: Bir Datastage geliştiricisi olarak, yerel sisteme yüklenmesi gereken bir Datastage tasarımcısı olarak bilinen Datastage istemci arayüzü üzerinde çalışıyoruz. Arka uçta Datastage sunucusuna bağlanır.
S # 9) Datastage'daki farklı ortak hizmetler nelerdir?
Yanıtlar: Datastage'da yaygın olarak kullanılan hizmetlerin listesi aşağıdadır:
- Meta veri hizmetleri
- Birleşik hizmet dağıtımı
- Güvenlik Servisi
- Döngü ve raporlama hizmetleri.
S # 10) Bir Datastage projesi geliştirmeye nasıl başlarsınız?
Yanıtlar: İlk adım, Datastage sunucusunda bir Datastage işi oluşturmaktır. Oluşturduğumuz tüm Datastage nesneleri Datastage projesinde saklanır. Datastage projesi, işler, tablolar, tanımlar ve rutinler için sunucudaki ayrı bir ortamdır.
Datastage projesi, işler, tablolar, tanımlar ve rutinler için sunucudaki ayrı bir ortamdır.
S # 11) DataStage işi nedir?
Yanıtlar: Datastage işi, geliştirici olarak oluşturduğumuz bir DataStage kodudur. Veri ve süreç akışını tanımlamak için birbirine bağlı farklı aşamalar içerir.
Aşamalar, uygulanan işlevlerden başka bir şey değildir.
Örneğin: Satış miktarının toplamını yapmak istediğimi varsayalım. Bu, bir aşamada gerçekleştirilecek bir 'gruplama' işlemi olabilir.
Şimdi sonucu bir hedef dosyaya yazmak istiyorum. Yani bu işlem başka bir aşamada yapılacaktır. Her iki aşamayı da tanımladıktan sonra, 'grup bazında' aşamadan hedef dosya aşamasına veri akışını tanımlamam gerekiyor. Bu veri akışı DataStage bağlantıları tarafından tanımlanır.
Her iki aşamayı da tanımladıktan sonra, 'grup bazında' aşamadan hedef dosya aşamasına veri akışını tanımlamam gerekiyor. Bu veri akışı DataStage bağlantıları tarafından tanımlanır.
S # 12) DataStage dizileri nedir?
Yanıtlar: Datastage dizisi, DataStage işlerini mantıksal bir akışta birbirine bağlar.
S # 13) Aynı kod parçasını farklı işlerde kullanmak istiyorsanız, bunu nasıl başaracaksınız?
Yanıtlar: Bu, paylaşılan kapsayıcılar kullanılarak yapılabilir. Yeniden kullanılabilirlik için paylaşımlı konteynerlerimiz var. Paylaşılan bir kapsayıcı, aşamalardan ve bağlantılardan oluşan yeniden kullanılabilir bir iş öğesidir. Farklı Datastage işlerinde paylaşılan bir konteyner çağırabiliriz.
S # 14) Datastage işleri nerede depolanır?
Yanıtlar: Datastage işleri havuzda depolanır. Datastage işlerini saklayabileceğimiz çeşitli klasörlerimiz var.
S # 15) Tasarımcıda farklı aşamaları nerede görüyorsunuz?
Yanıtlar: Tüm aşamalar adı verilen bir pencere içinde mevcuttur ' Palet ' . Sahnenin sağladığı işlevin türüne bağlı olarak çeşitli kategorilere sahiptir.
Paletteki çeşitli aşama kategorileri şunlardır: Genel, Veri Kalitesi, Veritabanı, Geliştirme, Dosya, İşleme vb.
S # 16) İşleme aşamaları nelerdir?
Yanıtlar: İşleme aşamaları, gerçek veri dönüşümünü uygulamamıza izin verir.
Örneğin , The ' İşleme kategorisi altındaki toplayıcı aşaması, tüm 'gruplama' işlemlerini uygulamamıza olanak tanır. Benzer şekilde, İşleme'de iki farklı giriş akışından gelen verileri bir araya getirmemize olanak tanıyan 'Birleştirme' aşaması gibi başka aşamalarımız da var.
S # 17) Basit bir temel Datastage işi oluşturmak için gerekli adımlar nelerdir?
Yanıtlar: Dosyaya tıklayın -> Yeni'ye tıklayın -> Paralel İş Seç ve Tamam'a basın. Paralel bir iş penceresi açılacaktır. Bu Paralel işte, farklı aşamaları bir araya getirip aralarındaki veri akışını tanımlayabiliriz. En basit DataStage işi bir ETL işidir.
Bunda, önce bir dosya aşaması veya veritabanı aşaması kullanabileceğimiz kaynak sistemden verileri çıkarmamız gerekir çünkü kaynak sistemim bir veritabanı tablosu veya bir dosya olabilir.
Bir metin dosyasından veri okuduğumuzu varsayalım. Bu durumda, 'Sıralı Dosya' aşamasını paralel iş penceresine sürükleyip bırakacağız. Şimdi, bu verilere ek olarak bir miktar dönüşüm gerçekleştirmemiz gerekiyor. İşleme kategorisi altında bulunan 'Transformer' aşamasını kullanacağız. Transformer aşaması altında herhangi bir mantık yazabiliriz.
Son olarak, işlenen verileri bazı hedef tablolara yüklememiz gerekiyor. Diyelim ki hedef veritabanım DB2. Bunun için DB2 bağlayıcı aşamasını seçeceğiz. Daha sonra bu veri durumlarını sıralı bağlantılar aracılığıyla birbirine bağlayacağız.
Bundan sonra , aşamaları doğru dosya sistemini veya veritabanını gösterecek şekilde yapılandırmamız gerekir.
0 ile 10 arasında c ++ rasgele sayı
Örneğin, Sıralı dosya aşaması için, dosya adı, dosya konumu, sütun meta verileri gibi zorunlu parametreleri tanımlamamız gerekir.
Ardından Datastage işini derlememiz gerekiyor. İşin derlenmesi, işin sözdizimini kontrol eder ve çalışma zamanında yürütülebilen Datastage işi için yürütülebilir bir dosya oluşturur.
S # 18) Datastage'da farklı sıralama yöntemlerini adlandırın.
Yanıtlar: Kullanılabilen iki yöntem vardır:
- Bağlantı sıralaması
- Dahili Veri Yayın Sıralaması
S # 19) Bir toplu işte, arada bir iş başarısız olursa ve toplu işi sıfırdan değil, o belirli işten yeniden başlatmak istiyorsanız, o zaman ne yapacaksınız?
Yanıtlar: Datastage'da, iş sırasında bir seçenek vardır - 'Sıranın başarısız olması durumunda yeniden başlatılabilmesi için kontrol noktaları ekleyin' . Bu seçenek işaretlenirse, iş sırasını başarısız olduğu noktadan yeniden çalıştırabiliriz.
S # 20) Datastage işlerini nasıl içe ve dışa aktarıyorsunuz?
Cevaplar: F veya bu, bunun için komut satırı işlevlerinin altında
- İthalat: dsimport.exe
- İhracat: dsexport.exe
S # 21) Datastage'daki rutinler nelerdir? Çeşitli rutin türlerini listeleyin.
Cevaplar: Rutin DS yöneticisi tarafından tanımlanan bir dizi işlevdir. Transformatör kademesi üzerinden çalıştırılır.
3 tür rutin vardır:
- Paralel rutinler
- Ana bilgisayar rutinleri
- Sunucu rutinleri
S # 22) DataStage'deki yinelenen değerleri nasıl kaldırırsınız?
Yanıtlar: Yinelenen değerleri işlemenin iki yolu vardır
- Yinelenenleri ortadan kaldırmak için yinelenen aşamayı kaldır'ı kullanabiliriz.
- Yinelenenleri kaldırmak için Sıralama aşamasını kullanabiliriz. Sıralama aşaması, 'kopyalara izin ver' adlı bir özelliğe sahiptir. Bu özelliği false olarak ayarladığınızda sıralama çıktısında yinelenen değerler almayacağız.
S # 23) Bir Datastage yöneticisinde bulunan farklı görünüm türleri nelerdir?
Yanıtlar: Datastage yöneticisinde mevcut 3 tür görünüm vardır. Onlar:
- Günlük görünümü
- Durum görünümü
- İş görünümü
S # 24) Informatica ve Datastage arasında ayrım yapın. Hangisini seçerdiniz ve neden?
Yanıtlar: Hem Informatica hem de DataStage güçlü ETL araçlarıdır.
Listelenen noktalar, her iki araç arasında farklılık gösterir:
Bilgi işlem | Datastage | |
---|---|---|
Paralel İşleme | Informatica, paralel işlemeyi desteklemez. | Bunun aksine, veri yayını, paralel işleme için bir mekanizma sağlar. |
SCD'lerin Uygulanması | Informatica'da SCD'leri (yavaş değişen boyutlar) uygulamak oldukça basittir. | Ancak, veri dağıtımında SCD'leri uygulamak karmaşıktır. Datastage, SCD'leri yalnızca özel komut dosyaları aracılığıyla destekler. |
Sürüm Kontrolü | Informatica, nesnelerin check-in ve check-out işlemleri aracılığıyla sürüm kontrolünü destekler. | Ancak, veri yayınında bu işlevselliğe sahip değiliz. |
Kullanılabilir Dönüşümler | Daha az dönüşüm mevcuttur. | Datastage, Informatica'dan daha çeşitli dönüşümler sunar. |
Arama gücü | Informatica çok güçlü dinamik önbellek araması sağlar | Veri yayınında benzer bir şeyimiz yok. |
Kişisel görüşüme göre, Datastage üzerinden Informatica ile giderdim. Informatica'yı DataStage'den daha sistematik ve kullanıcı dostu bulmamın nedeni.
Başka bir güçlü neden de, hata ayıklama ve hata işlemenin Datastage'a kıyasla Informatica'da çok daha iyi olmasıdır. Böylece, Informatica'da sorunları çözmek daha kolay hale geliyor. Datastage, tam hata işleme desteği sağlamaz.
=> Informatica hakkında daha fazla şey öğrenmek ister misiniz? Bizde ayrıntılı açıklama burada.
test planı ve test stratejisi arasındaki fark
S # 25) Sistem değişkenleri hakkında bir fikir verin.
Yanıtlar: Sistem değişkenleri, ile başlayan salt okunur değişkenlerdir '@' transformatör aşaması veya rutin olarak okunabilir. Sistem bilgilerini almak için kullanılırlar.
S # 26) Pasif aşama ile aktif aşama arasındaki fark nedir?
Yanıtlar: Ekstraksiyon ve yükleme için pasif aşamalar kullanılırken, dönüşüm için aktif aşamalar kullanılır.
S # 27) Datastage'da bulunan çeşitli kapsayıcı türleri nelerdir?
Yanıtlar: Datastage'da 2'nin altında konteynerimiz var:
- Yerel konteyner
- Paylaşılan kapsayıcı
S # 28) Aşama değişkeninin değeri geçici mi yoksa kalıcı olarak mı saklanıyor?
Yanıtlar: Geçici. Geçici bir değişkendir.
S # 29) Datastage'daki farklı iş türleri nelerdir?
Yanıtlar: Datastage'da iki tür işimiz var:
- Sunucu işleri (Sıralı bir şekilde çalışırlar)
- Paralel işler (Paralel bir şekilde yürütülürler)
S # 30) Datastage direktörünün kullanımı nedir?
Yanıtlar: Datastage yöneticisi aracılığıyla bir işi planlayabilir, işi doğrulayabilir, işi yürütebilir ve işi izleyebiliriz.
S # 31) Çeşitli hash dosyası türleri nelerdir?
Yanıtlar: 2 tür hash dosyamız var:
- Statik karma dosyası
- Dinamik karma dosyası
S # 32) Kalite aşaması nedir?
Yanıtlar: Kalite aşaması (bütünlük aşaması olarak da adlandırılır), farklı kaynaklardan gelen verilerin bir araya getirilmesine yardımcı olan bir aşamadır.
Sonuç
Datastage mimarisi, ana özellikleri hakkında kullanışlı bir bilgi sahibi olmalısınız ve diğer bazı popüler ETL araçlarından ne kadar farklı olduğunu açıklayabilmelisiniz.
bunlara ek olarak , Farklı aşamalar ve kullanımları, bir Datastage işi yaratmanın ve çalıştırmanın uçtan uca bir yolu hakkında adil bir fikriniz olmalıdır.
Önerilen Okuma => ETL Testi nedir?
Herşey gönlünce olsun!
Önerilen Kaynaklar
- ETL Test Mülakat Soruları ve Cevapları
- ETL Sürecinde Yararlı En İyi 10 Veri Eşleme Aracı (2021 LİSTESİ)
- 2021'deki En İyi 15 ETL Aracı (Tam Güncellenmiş Liste)
- Örneklerle Veri Ambarı Test Eğitimi | ETL Test Kılavuzu
- ETL Test Veri Ambarı Test Eğitimi (Tam Kılavuz)
- ETL ve DB Testi - ETL Test İhtiyacı, Planlama ve ETL Araçlarına Daha Yakından Bakış
- Informatica PowerCenter Aracını Kullanarak ETL Testi Nasıl Gerçekleştirilir
- Veri Ambarı'ndaki (ETL) Meta Veriler Örneklerle Açıklandı
- Basın Bülteni - ETL Test ve Veri Taşıma Test Platformunun iCEDQ Yumuşak Yeni Sürüm Sürümü
- 2021'de En İyi 10 ETL Test Aracı
- Veri Ambarı'nda ETL (Çıkart, Dönüştür, Yükle) İşlemi Nedir?