top 24 data modeling interview questions with detailed answers
En Sık Sorulan Veri Modelleme Görüşme Soruları ve Yaklaşan Görüşmeye Hazırlanmanıza Yardımcı Olacak Cevapların Listesi:
Burada, birkaç ünlü BT çokuluslu şirketindeki mülakat etkileşimleri sırasında kendi deneyimlerime dayalı olarak bazı Veri Modelleme mülakat sorularını ve ayrıntılı yanıtları paylaşacağım.
Veri Modellemeyle yüzleşme veya röportaj yapma şansı yakalarsanız, aşağıdaki soru cevapları size çok yardımcı olabilir.
En Sık Sorulan Veri Modelleme Görüşme Soruları
Hadi başlayalım!
S # 1) Veri Modellemeden ne anlıyorsunuz?
Cevap: Veri Modelleme varlıkların birbirleriyle nasıl ilişkili olduğunu gösteren diyagramatik temsildir. Veritabanı tasarımına giden ilk adımdır. Önce kavramsal modeli, ardından mantıksal modeli oluşturuyoruz ve son olarak fiziksel modele geçiyoruz.
Veri modelleri genellikle yazılım geliştirme yaşam döngüsünün veri analizi ve tasarım aşamasında oluşturulur.
S # 2) Farklı veri modelleri hakkındaki anlayışınızı açıklayın.
Cevap: Üç tür veri modeli vardır - kavramsal, mantıksal ve fiziksel. Karmaşıklık ve ayrıntı düzeyi, kavramsaldan mantığa, fiziksel veri modeline doğru artar.
Kavramsal model, çok temel yüksek bir tasarım düzeyini gösterirken, fiziksel veri modeli çok ayrıntılı bir tasarım görünümünü gösterir.
- Kavramsal model sadece varlık adlarını ve varlık ilişkilerini tasvir edecektir. Bu makalenin sonraki bölümünde gösterilen Şekil 1, kavramsal bir modeli tasvir etmektedir.
- Mantıksal Model her varlıktaki varlık adlarını, varlık ilişkilerini, öznitelikleri, birincil anahtarları ve yabancı anahtarları gösterecektir. Bu makaledeki 4. soruda gösterilen Şekil 2, mantıksal bir modeli tasvir etmektedir.
- Fiziksel Veri Modeli birincil anahtarları, yabancı anahtarları, tablo adlarını, sütun adlarını ve sütun veri türlerini gösterecektir. Bu görüş aslında modelin veritabanında gerçekte nasıl uygulanacağını açıklamaktadır.
S # 3) Bugüne kadar üzerinde çalıştığınız projelerle ilgili Veri Modelleme deneyiminize biraz ışık tutmak ister misiniz?
Not: Bu, Veri Modelleme görüşmelerimden birindeki ilk soruydu. Bu nedenle, mülakat tartışmasına girmeden önce, veri modellemenin üzerinde çalıştığınız ödevlere nasıl uyduğuna dair çok net bir resme sahip olmalısınız.
Cevap: Bir sağlık sigortası sağlayıcı şirketi için, yerleşik arayüzlerimizin bulunduğu bir proje üzerinde çalıştım. Bilgi işlem Facets veritabanından alınan verileri dönüştürüp işleyen ve satıcılara yararlı bilgiler gönderen.
Not: Facets, sağlık sektörü için tüm bilgileri yönetmek için uçtan uca bir çözümdür. Projemdeki facets veritabanı SQL server 2012 ile oluşturuldu.
Birbirine bağlı farklı varlıklarımız vardı. Bu varlıklar abone, üye, sağlık hizmeti sağlayıcısı, talep, fatura, kayıt, grup, uygunluk, plan / ürün, komisyon, kişi başı vb. İdi.
Aşağıda, projenin yüksek düzeyde nasıl göründüğünü gösteren kavramsal Veri Modeli bulunmaktadır.
Şekil 1:
Veri varlıklarının her birinin kendi veri öznitelikleri vardır. Örneğin, sağlayıcının bir veri özelliği sağlayıcı kimlik numarası olacak, üyeliğin birkaç veri özelliği abone kimliği, üye kimliği olacak, hak talebinin veri özelliklerinden biri talep numarası olacak, her sağlık hizmeti ürünü veya planı benzersiz bir ürün kimliğine sahip olacak ve yakında.
S # 4) Veri Modellemedeki farklı tasarım şemaları nelerdir? İle açıklayınmisal?
Cevap: Veri modellemede iki farklı şema türü vardır
- Yıldız Takvimi
- Kar Tanesi Şeması
Şimdi, bu şemaların her birini tek tek açıklayacağım.
Şemaların en basiti, merkezde etrafındaki çoklu boyut tablolarına referans veren bir olgu tablosunun olduğu yıldız şemasıdır. Tüm boyut tabloları olgu tablosuna bağlıdır. Tüm boyut tablolarındaki birincil anahtar, olgu tablosunda yabancı anahtar görevi görür.
IS diyagramı Bu şemanın (bkz.Şekil 2) bir yıldızın şeklini andırmasının nedeni bu şemaya yıldız şeması adı verilmiştir.
Şekil 2:
Yıldız şeması oldukça basit, esnektir ve normalize edilmemiş formdadır.
Bir kar tanesi şemasında normalleşme seviyesi artar. Buradaki olgu tablosu yıldız şemasındaki ile aynı kalır. Ancak boyut tabloları normalleştirilmiştir. Birkaç boyut tablosu katmanından dolayı bir kar tanesi gibi görünür ve bu nedenle kar tanesi şeması olarak adlandırılır.
alfa ve beta testi nedir
Figür 3:
S # 5) Projenizde hangi şemayı kullandınız ve neden?
S # 6) Hangi şema daha iyidir - yıldız mı yoksa kar tanesi mi?
Cevap: (Q # 5 ve 6 için birleştirilmiştir): Şema seçimi her zaman proje gereksinimlerine ve senaryolarına bağlıdır.
Yıldız şeması normalleştirilmiş biçimde olduğundan, sorgu için daha az birleştirme gerekir. Sorgu basittir ve bir yıldız şemasında daha hızlı çalışır. Kar tanesi şemasına gelince, normalleştirilmiş formda olduğundan, bir yıldız şemasına kıyasla bir dizi birleştirme gerektirecek, sorgu karmaşık olacak ve yürütme yıldız şemasından daha yavaş olacaktır.
Bu iki şema arasındaki bir diğer önemli fark, kar tanesi şemasının fazlalık veri içermemesi ve dolayısıyla bakımının kolay olmasıdır. Aksine, yıldız şeması yüksek bir fazlalık düzeyine sahiptir ve bu nedenle sürdürülmesi zordur.
Şimdi, projeniz için hangisini seçmelisiniz? Projenizin amacı daha fazla boyut analizi yapmaksa, kar tanesi şemasına gitmelisiniz. Örneğin, eğer onu bulman gerekiyorsa 'Şu anda aktif olan belirli bir plana kaç abone bağlı?' - kar tanesi modeliyle gidin.
Projenizin amacı daha fazla metrik analizi yapmaksa, bir yıldız şeması kullanmalısınız. Örneğin, eğer onu bulman gerekiyorsa 'Belirli bir aboneye ödenen talep tutarı nedir?' - bir yıldız şemasıyla gidin.
Projemde kar tanesi şeması kullandık çünkü çeşitli boyutlarda analiz yapmak ve işletme için özet raporlar oluşturmak zorundaydık. Kar tanesi şemasını kullanmanın bir başka nedeni de daha az bellek tüketimiydi.
S # 7) Boyut ve nitelikten ne anlıyorsunuz?
Cevap: Boyutlar, nitel verileri temsil eder. Örneğin, plan, ürün, sınıf tüm boyutlardır.
Bir boyut tablosu, açıklayıcı veya metinsel nitelikler içerir. Örneğin, ürün kategorisi ve ürün adı, ürün boyutunun özellikleridir.
S # 8) Olgu ve olgu tablosu nedir?
Cevap: Gerçekler, nicel verileri temsil eder.
Örneğin, ödenmesi gereken net tutar bir gerçektir. Olgu tablosu, ilgili boyutsal tablolardan sayısal verileri ve yabancı anahtarları içerir. Olgu tablosunun bir örneği yukarıda gösterilen Şekil 2'den görülebilir.
S # 9) Karşılaştığınız farklı boyut türleri nelerdir? Her birini bir örnekle ayrıntılı olarak açıklayın.
Cevap: Tipik olarak beş tür boyut vardır.
a) Uygun boyutlar : Farklı alanların bir parçası olarak kullanılan bir Boyuta uyumlu boyut denir. Farklı olgu tabloları ile tek bir veri tabanında veya çok sayıda veri reyonu / ambarında kullanılabilir.
Örneğin, abone boyutu iki olgu tablosuna - faturalama ve talep - bağlanırsa, abone boyutu uyumlu bir boyut olarak değerlendirilecektir.
b) Önemsiz Boyut : Olgu tablosunda veya mevcut boyut tablolarının hiçbirinde yeri olmayan özniteliklerden oluşan bir boyut tablosudur. Genel olarak , bunlar bayraklar veya göstergeler gibi özelliklerdir.
Örneğin, 'Y' veya 'N' olarak ayarlanmış bir üye uygunluk bayrağı veya doğru / yanlış olarak ayarlanmış herhangi bir başka gösterge, herhangi bir özel yorum vb. olabilir, bu tür tüm gösterge özelliklerini olgu tablosunda tutarsak boyutu artar. Yani , tüm bu özellikleri birleştiririz ve tüm gösterge değerlerinin olası bir kombinasyonuyla benzersiz önemsiz kimliklere sahip önemsiz boyut adı verilen tek bir boyut tablosu koyarız.
c) Rol Oynama Boyutu : Aynı veri tabanında birden çok amaç için kullanılan boyutlardır.
Örneğin, 'Talep Tarihi', 'Faturalama tarihi' veya 'Plan Süresi tarihi' için bir tarih boyutu kullanılabilir. Yani , böyle bir boyut, Rol yapma boyutu olarak adlandırılacaktır. Tarih boyutunun birincil anahtarı, olgu tablosundaki birden çok yabancı anahtarla ilişkilendirilecektir.
d) Yavaşça Değişen Boyut (SCD): Bunlar tüm boyutlar arasında en önemlileridir. Bunlar, öznitelik değerlerinin zamana göre değiştiği boyutlardır. Aşağıda çeşitli SCD türleri bulunmaktadır
- Tip-0: Bunlar, öznitelik değerinin zamanla sabit kaldığı boyutlardır. Örneğin, Abonenin DOB'si bir tip 0 SCD'dir çünkü zamandan bağımsız olarak her zaman aynı kalacaktır.
- Tip-1: Bunlar, özelliğin önceki değerinin mevcut değerle değiştirildiği boyutlardır. Tip-1 boyutunda geçmiş tutulmaz. Örneğin, Abonenin adresi (işletmenin, abonenin tek geçerli adresini tutması gereken yer), Tip-1 boyutu olabilir.
- Tip 2: Bunlar sınırsız tarihin korunduğu boyutlardır. Örneğin, Abonenin adresi (işletmenin, abonenin önceki tüm adreslerinin kaydını tutması gereken yer). Bu durumda, bir abone için birden fazla satır farklı adresleriyle birlikte tabloya eklenecektir. Mevcut adresi tanımlayacak bazı sütun (lar) olacaktır. Örneğin, 'Başlangıç tarihi' ve 'Bitiş tarihi'. 'Bitiş tarihi' değerinin boş olacağı satır, abonenin mevcut adresini içerecek ve diğer tüm satırlar abonenin önceki adreslerini içerecektir.
- Tip-3: Bunlar, sınırlı geçmişin korunduğu boyut türleridir. Ve geçmişi korumak için ek bir sütun kullanıyoruz. Örneğin, Abonenin adresi (işletmenin mevcut ve yalnızca önceki bir adresin kaydını tutması gereken yer). Bu durumda, 'adres' sütununu iki farklı sütuna ayırabiliriz - 'mevcut adres' ve 'önceki adres'. Böylece, birden çok satıra sahip olmak yerine, abonenin önceki adresini ve aynı zamanda güncel olanı gösteren tek satıra sahip olacağız.
- Tip-4: Bu boyut türünde, geçmiş veriler ayrı bir tabloda korunur. Ana boyut tablosu yalnızca mevcut verileri tutar. Örneğin, ana boyut tablosu, geçerli adresini tutan abone başına yalnızca bir satıra sahip olacaktır. Abonenin diğer tüm önceki adresleri ayrı geçmiş tablosunda tutulacaktır. Bu tür bir boyut neredeyse hiç kullanılmaz.
e) Bozulmuş Boyut: Bozulmuş boyut, gerçek olmayan ancak olgu tablosunda birincil anahtar olarak sunulan bir boyuttur. Kendi boyut tablosuna sahip değildir. Bunu tek özellikli bir boyut tablosu olarak da adlandırabiliriz.
Fakat , onu bir boyut tablosunda ayrı tutmak ve ek bir birleşim koymak yerine, bu özelliği doğrudan bir anahtar olarak olgu tablosuna koyarız. Kendi boyut tablosuna sahip olmadığı için, olgu tablosunda hiçbir zaman yabancı anahtar olarak hareket edemez.
S # 10) Bilgisiz gerçeklerle ilgili fikrinizi mi verin? Ve neden kullanıyoruz?
Cevap: Olgusuz olgu tablosu, içinde hiçbir olgu ölçüsü içermeyen bir olgu tablosudur. İçinde sadece boyut anahtarları var.
ps4 için en iyi sanal gerçeklik başlığı
Zaman zaman, gerçeklerden bağımsız bir bilgi tablosuna sahip olmanız gereken bazı durumlar ortaya çıkabilir.
Örneğin, bir çalışan katılım kayıt sistemi sürdürdüğünüzü varsayalım, üç anahtar içeren gerçeklerden bağımsız bir olgu tablosuna sahip olabilirsiniz.
Çalışan kimliği |
Department_ID |
Time_ID |
Yukarıdaki tablonun herhangi bir ölçü içermediğini görebilirsiniz. Şimdi, aşağıdaki soruyu cevaplamak istiyorsanız, iki ayrı olgu tablosuna sahip olmak yerine yukarıdaki tek olgusuz olgu tablosunu kolayca kullanabilirsiniz:
'Belirli bir günde belirli bir departmanın kaç çalışanı vardı?'
Bu nedenle, gerçeklerden bağımsız olgu tablosu tasarıma esneklik sağlar.
S # 11) OLTP ve OLAP arasında ayrım yapmak?
Cevap: OLTP, Online İşlem İşleme Sistemi & OLAP, Çevrimiçi Analitik İşleme Sistemi . OLTP, işletmenin işlem verilerini korur ve genel olarak oldukça normalleştirilir. Aksine, OLAP analiz ve raporlama amaçlıdır ve normalize edilmemiş formdadır.
OLAP ve OLTP arasındaki bu fark, size şema tasarımını seçme yolunu da verir. Sisteminiz OLTP ise yıldız şema tasarımına, sisteminiz OLAP ise kar tanesi şemasına geçmelisiniz.
S # 12) Data mart'tan ne anlıyorsunuz?
Cevap: Veri reyonları çoğunlukla tek bir iş koluna yöneliktir. Bireysel departmanlar için tasarlanmıştır.
Örneğin, Finans, Raporlama, Satış gibi farklı departmanları olan bir sağlık sigortası şirketi için çalışıyordum.
Tüm bu departmanlarla ilgili bilgileri tutan bir veri ambarımız vardı ve sonra bu veri ambarının üzerine inşa edilmiş birkaç veri reyonumuz var. Bu DataMart, her departmana özeldi. Basit bir deyişle, DataMart'ın bir veri ambarının bir alt kümesi olduğunu söyleyebilirsiniz.
S # 13) Farklı ölçü türleri nelerdir?
Cevap: Üç tür önlemimiz var:
- Katkısız önlemler
- Yarı katkı önlemleri
- Katkı önlemleri
Katkısız önlemler, üstüne hiçbir toplama işlevi uygulanamayan önlemlerdir. Örneğin, bir oran veya yüzde sütunu; E / H, vb. gibi değerleri tutan gerçekte tabloda bulunan bir bayrak veya gösterge sütunu, toplamsal olmayan bir ölçüdür.
Yarı eklemeli önlemler, bazı (ama hepsi değil) toplama işlevlerinin uygulanabildiği önlemlerdir. Örneğin, ücret oranı veya hesap bakiyesi.
Ek önlemler, tüm toplama işlevlerinin uygulanabildiği önlemlerdir. Örneğin, satın alınan birimler.
S # 14) Vekil anahtar nedir? Birincil anahtardan farkı nedir?
Cevap: Vekil Anahtar, benzersiz bir tanımlayıcı veya birincil anahtar olarak işlev görebilen sistem tarafından oluşturulmuş bir sıra numarası anahtarıdır. Bir sütun veya sütunların bir kombinasyonu olabilir. Birincil anahtarın aksine, mevcut uygulama veri alanlarından alınmaz.
S # 15) Bu, tüm veritabanlarının 3NF'de olması gerektiği doğru mu?
Cevap: Bir veritabanının 3NF'de olması zorunlu değildir. ancak , Amacınız verilerin kolay bakımı, daha az yedeklilik ve verimli erişim ise, o zaman normalize edilmemiş bir veritabanı kullanmalısınız.
S # 16) Hiç yinelemeli ilişkiler senaryosuyla karşılaştınız mı? Cevabınız evet ise, nasıl idare ettiniz?
Cevap: Özyinelemeli bir ilişki, bir varlığın kendisiyle ilişkili olması durumunda ortaya çıkar. Evet, böyle bir senaryo ile karşılaştım.
Sağlık hizmetleri alanı hakkında konuşursak, bir sağlık hizmeti sağlayıcısının (örneğin, bir doktor) başka herhangi bir sağlık hizmeti sağlayıcısının hastası olma olasılığı vardır. Çünkü , Doktorun kendisi hastalanırsa ve ameliyat olması gerekiyorsa, cerrahi tedavi için başka bir doktora gitmesi gerekecektir.
Yani , bu durumda, varlık - sağlık hizmeti sunucusu kendisiyle ilişkilidir. Sağlık sigortası sağlayıcısının numarasına ait bir yabancı anahtar, her üyenin (hasta) kaydında sunulmalıdır.
S # 17) Veri Modelleme sırasında karşılaşılan birkaç yaygın hatayı listeleyin.
Cevap: Veri Modelleme sırasında karşılaşılan birkaç yaygın hata şunlardır:
- Devasa veri modelleri oluşturma : Büyük veri modellerinde daha fazla tasarım hatası vardır. Veri modelinizi 200'den fazla tabloyla sınırlamamaya çalışın.
- Amaç eksikliği : İş çözümünüzün ne için tasarlandığını bilmiyorsanız, yanlış bir veri modeli ile karşılaşabilirsiniz. Bu nedenle, doğru veri modelini bulmak için iş amacına açıklık getirmek çok önemlidir.
- Yedek anahtarların uygunsuz kullanımı : Vekil anahtar gereksiz yere kullanılmamalıdır. Vekil anahtarı yalnızca doğal anahtar birincil anahtarın amacına hizmet edemediğinde kullanın.
- Gereksiz normalleştirme : Bunu yapmak için sağlam ve net bir ticari nedeniniz olmadıkça ve olmadıkça normalleştirmeyin çünkü normalizasyondan arındırma, bakımı zor olan gereksiz veriler oluşturur.
S # 18) Tek bir üst tablodan oluşturulabilen alt tabloların sayısı nedir?
Cevap: Tek üst tablodan oluşturulabilen alt tabloların sayısı, üst tablodaki anahtar olmayan alanların / sütunların sayısına eşittir.
S # 19) Çalışan sağlık bilgileri, sağlık hizmeti sağlayıcısı tarafından işvereninden gizleniyor. Bu hangi düzeyde veri gizleme? Kavramsal mı, fiziksel mi yoksa harici mi?
Cevap: Bu, harici bir veri gizleme seviyesi senaryosudur.
S # 20) Olgu tablosu ve boyut tablosunun biçimi nedir?
Cevap: Genel olarak, olgu tablosu normalleştirilmiş biçimdedir ve boyut tablosu normalleştirilmiş biçimdedir.
S # 21) Bir sağlık hizmetleri alanı projesinde kavramsal bir model bulmak için hangi ayrıntılara ihtiyacınız vardır?
Cevap: Bir sağlık projesi için, aşağıdaki ayrıntılar temel bir kavramsal model tasarlama gereksinimini karşılayacaktır.
- Farklı sağlık bakım planları ve ürünleri kategorileri.
- Abonelik türü (grup veya bireysel).
- Sağlık hizmeti sağlayıcıları kümesi.
- Talep ve faturalama sürecine genel bakış.
S # 22) Zor olan: Bir sütuna benzersiz bir kısıtlama uygulanırsa, o sütuna iki sıfır eklemeye çalışırsanız bir hata verir mi?
Cevap: Hayır, bu durumda herhangi bir hata atmaz çünkü boş bir değer başka bir boş değere eşit değildir. Böylece, sütuna herhangi bir hata olmadan birden fazla boş değer girilecektir.
S # 23) Bir alt tip ve süper tip varlık örneği verebilir misiniz?
Cevap: Evet, bu farklı varlıklara sahip olduğumuzu varsayalım - araç, araba, bisiklet, ekonomik araba, aile arabası, spor araba.
Burada araç, süper tip bir varlıktır. Araba ve bisiklet, alt tip varlıklarıdır. Dahası, ekonomik arabalar, spor arabalar ve aile arabaları, süper tip varlık arabasının alt tip varlıklarıdır.
Süper tip bir varlık, daha yüksek bir seviyede olandır. Alt tür varlıklar, belirli özelliklere göre gruplandırılanlardır. Örneğin, tüm bisikletler iki tekerlekli ve tüm arabalar dört tekerlekli. Ve her ikisi de araç olduğundan, süper tip varlıkları 'araç' dır.
S # 24) Meta verilerin önemi nedir?
Cevap: Meta veriler, verilerle ilgili verilerdir. Sistemde gerçekte ne tür verilerin depolandığını, amacının ne olduğunu ve kime yönelik olduğunu size söyler.
Sonuç
- Pratik anlayış Veri Modelleme kavramı ve sizin tarafınızdan yapılan görevlere nasıl uyacağı, bir veri modelleme görüşmesini kırmak için çok gereklidir.
- En sık sorulan konular Veri Modelleme mülakat - farklı veri modelleri türleri, şema türleri, boyut türleri ve normalleştirme.
- Senaryo temelli sorular için de hazırlıklı olun.
Görüşmeciye bir soruyu yanıtladığınız zaman, fikri bir örnekle açıklamanızın daha iyi olacağını öneririm. Bu, o alanda gerçekten çalıştığınızı ve konseptin özünü çok iyi anladığınızı gösterir.
Herşey gönlünce olsun!!
chrome için en iyi reklam engelleyici nedir