oracle data warehouse
OLTP (Çevrimiçi İşlem İşleme) Sistemiyle Avantajlar, Mimari, Riskler ve Karşılaştırma İçeren Oracle Veri Ambarı Kılavuzu:
Önceki öğreticide Kapsamlı Oracle Kılavuzu , Oracle Ürün ve Hizmetleri hakkında, uygulamalar, veritabanları, işletim sistemi vb. gibi çeşitli alanlarda bilgi edindik. Bu makale, Oracle Veri Ambarı hakkında derinlemesine bilgi sağlayacaktır. Ancak bundan önce, önce İş Zekası (BI) kavramını anlamamıza izin verin.
İş zekası
İş Zekası, toplu verilerin yapılandırılmasına, rafine edilmesine ve özelleştirilmiş raporlar oluşturmak için müşteriler tarafından kullanılabilecek akıllı ve anlaşılır bir biçime dönüştürülmesine yardımcı olan belirli yöntemleri, teknolojileri, araçları ve uygulamaları bünyesinde barındıran bir yazılım alanıdır. kararlar.
Bu ihtiyaca hizmet etmek için Veri Ambarlama, OLAP (Çevrimiçi İşlem İşleme), Veri Madenciliği, Veri Entegrasyonu, Karar Mühendisliği, Elektronik Tablolar gibi farklı seçenekler mevcuttur.
Kurumsal Veri Ambarı (EDW), işletmelerin analitik ve raporlama ihtiyaçlarına hizmet eden BI'nin temel bileşenlerinden biridir. Veri Ambarı, daha sonra kullanılmak üzere birden çok kaynaktan alınan birleştirilmiş verileri tutan bir İlişkisel Veritabanı Yönetim Sistemidir (RDBMS).
youtube'u wav dosyasına ücretsiz dönüştür
Ne öğreneceksin:
- Oracle Veri Ambarı'na Genel Bakış
- OLTP Vs Veri Ambarı Karşılaştırması
- Zıt Veri Ambarı ve Veri Pazarı
- ETL Sürecine Genel Bakış
- Veri Ambarı Mimarisi
- Sonuç
Oracle Veri Ambarı'na Genel Bakış
Neden 'Veri Ambarı' olarak adlandırılıyor?
'Veri Ambarı' terimiyle ilişkilendirmek için 'depo' kelimesinin anlamını hatırlamaya çalışalım.
Fiziksel bir depo, çeşitli kaynaklardan alınan malların depolanması için kullanılan ve daha sonra ihtiyaçlarına göre müşteriye tedarik edilebilecek bir depodur.
(resim kaynak )
Benzer şekilde, veri ambarı, çeşitli kaynak sistemlerden alınan bir veri havuzudur. Bu kaynaklar, veri reyonları, düz dosyalar gibi herhangi bir depolama sistemi veya İK, Satış, Operasyonlar, Kaynak Yönetimi ve Pazarlama gibi farklı kurumsal etki alanları için veri tutan herhangi bir medya depolama cihazı olabilir.
Veri Ambarına Sahip Olmanın Amacı
Bir kuruluş, veri ambarı kavramını duymuş olabilir, ancak bunu kendi kuruluşuna dahil edip etmemesi gerektiğinden emin olmayabilir. Yine de, farklı kaynaklardan gelen verileri ortak zemine dökmek ve bunları arşivlemek, böylece depolama alanının işlem sistemlerinden serbest bırakılması için her zaman bir ihtiyaç olacaktır. Bu, Veri Ambarlama sisteminin bir iş gereksinimi haline geldiği yerdir.
Pazarda büyümek için yönetim, ancak bir kuruluşun geçmiş trendlerini iyice inceledikten sonra verilebilecek karar vermede iyi olmalıdır. Bu nedenle, bu arşivlenmiş veriler, gelecekte iş analizi için başvurulabilmesi için veri ambarında iyi organize edilmiş ve hesaplanmış bir biçimde tutulur.
Veri Ambarının Faydaları
Veri Ambarı başarılı bir şekilde uygulanırsa aşağıdaki şekillerde faydalı olabilir:
# 1) İş zekası çözümlerinin gelişmiş bir versiyonunu sunarak analistlerin işlerini basitleştirdi. Birden çok kaynak sisteminden verileri çıkarır, dönüştürür ve analiz için işletme tarafından doğrudan sorgulanabilen depolar.
Ayrıca aşağıdakileri destekleyen çeşitli araçlar sunar:
- Özelleştirilmiş iş raporlarının oluşturulması.
- Gerekli bilgileri görüntüleyen etkileşimli gösterge tabloları.
- Yalnızca ayrıntıları almak için gösterge tablolarında ayrıntıya inme yeteneği.
- Veri Madenciliği ve Trend Analizi.
#iki) Çeşitli kaynak sistemlerden veri aldıktan sonra bile, bir veri ambarındaki veriler, ETL işlemi sırasında meydana gelen dönüşümlerin bir sonucu olarak tutarlı kalır. Tutarlı veriler, bir karar vericiye doğruluk açısından güven verir.
# 3) Paydaşların iş kararları almak için ihtiyaç duyduğu kritik veriler tek bir yerde mevcut olduğundan ve kolayca alınabildiğinden veri ambarları da zaman tasarrufu olarak tanımlanır.
# 4) Bunlar geçmiş verileri tutmak için tasarlanmıştır ve bu nedenle farklı zaman dilimlerinde eğilimleri incelemek için sorgulanabilir. Aynı zamanda paydaşların gelecekteki büyüme yolunu belirlemelerine yardımcı olur.
Veri Ambarı Kullanımında Karşılaşılan Riskler
Avantajların yanı sıra, her yeni uygulama, ilgilenilmesi gereken bir dizi risk de içerir.
Aşağıda yer alan risklerden bazıları listelenmiştir:
- Kaynak sistemlerin veri ambarlama sistemiyle uyumsuzluğu, çok fazla manuel iş yapmaya neden olabilir.
- ETL sürecinin yanlış zaman tahmini işin kesintiye uğramasına neden olabilir.
- Bunlar çok yüksek kaliteli depolama sistemleridir ve bu nedenle yüksek bakım gerektirir. Herhangi bir iş akışı veya iş değişikliği çok yüksek maliyetli olabilir.
- Bir veri ambarı kurmak, bir ambar tasarlamak için iş akışlarını anlamak ve entegrasyon yeteneklerini belirlemek için çok zamana ihtiyaç duyduğundan zaman alan bir süreçtir.
- Veri güvenliği, sızdırılırsa işletmeyi etkileyebilecek asırlık tarihi verileri tuttuğu için burada her zaman bir risktir.
OLTP Vs Veri Ambarı Karşılaştırması
OLTP ile Veri Ambarı arasındaki farklar aşağıdaki tablodan anlaşılabilir.
OLTP | Veri depolama |
---|---|
Ekleme ve Güncellemeler, OLTP sistemlerinde son kullanıcılar tarafından gerçekleştirilen başlıca işlemlerdir. | Veri Ambarları büyük ölçüde SELECT deyimi kullanılarak sorgulanır ve yalnızca ETL hizmetleri kullanılarak güncellenebilir. |
OLTP sistemleri ticari işlemleri destekler. | Veri Ambarı, tamamlanan ticari işlemleri analiz ettikten sonra alınan iş kararlarını destekler. |
Veriler uçucu kalır, yani değişmeye devam eder | Verilerin değiştirilmemesi gerekiyor. |
En güncel verileri tutarlar. | Tarihsel verileri tutarlar. |
Herhangi bir hesaplama yapmadan ham verileri tutar. | Özetlenmiş ve iyi hesaplanmış verileri tutar. |
Veriler normalleştirilecek. | Veriler normalize edilmemiş olarak kalacaktır. |
Oracle veritabanının boyutu 50MB ile 100GB arasında değişebilir. | Oracle veritabanının boyutu 100 GB ile 2 TB arasında değişebilir. |
Zıt Veri Ambarı ve Veri Pazarı
Veri Ambarı ve DataMart terimlerin ikisi de kulağa benzer gelmiyor ve veri depolamayla ilgili görünmüyor.
Windows 10 için en iyi python fikri
Evet, birbirleriyle ilişkilidir ve her ikisi de veri depolamak için kullanılır. İkisi arasındaki temel fark, verileri tutma kapasitesidir ve bu fark, son kullanıcıların sistemleri için doğru depolama birimini seçmelerine yardımcı olur.
Data Mart, veri ambarına kıyasla daha az veri tutma kapasitesine sahiptir ve bu nedenle onun bir alt kümesi olarak düşünülebilir. Veri reyonları genellikle belirli bir departman veya iş koluna ait olabilecek sınırlı verileri depolamak için tanımlanırken, veri ambarları herkes için birleştirilmiş verileri tutmak için kullanılabilir.
Moda, Aksesuarlar, Ev Eşyaları, Kitaplar ve Okul Malzemeleri, Elektronik Aletler vb. Gibi çeşitli ticari mal kategorilerine sahip bir e-ticaret web sitesi örneğini ele alalım.
Dolayısıyla, Veri reyonları ürün veri kategorisini akıllıca depolamak için tasarlanabilirken, veri ambarları geçmiş dahil olmak üzere eksiksiz web sitesi verilerini tek bir yerde depolamak için kullanılabilir.
Veri reyonları boyut olarak daha küçüktür ve bir veri ambarı tasarlamak için gerekli olan çok fazla analiz yapılmadan çok daha hızlı oluşturulabilir. Bununla birlikte, veri tutarlılığını korumak için birkaç veri reyonunu senkronize tutmak çok çaba gerektirir.
ETL Sürecine Genel Bakış
ETL (Çıkarma, Dönüştürme ve Yükleme), farklı kaynak sistemlerden veri çıkarma, dönüştürme ve Veri Ambarı sistemine yükleme işlemidir. Veri çıkarma için çeşitli kaynak sistemleriyle etkileşime girmesi gereken karmaşık bir süreçtir ve bu nedenle teknik olarak da zorlayıcıdır.
Dönüşüm, kaynak sistemlerin biçimini anlamak ve verileri ortak biçime getirmek için yine çok sayıda analize ihtiyaç duyar, böylece aynı veriler veri ambarında depolanabilir.
ETL süreci, iş gereksinimine bağlı olarak günlük, haftalık ve hatta aylık olarak çalışabilen yinelenen bir iştir.
Veri Ambarı Mimarisi
Öncelikle önceden tanımlanmış iş gereksinimleri için iyileştirilmiş verileri depolamak üzere tasarlanmış bir Veri Ambarı mimarisini anlayalım. Mimari, yukarıdan aşağıya veri akışı olan 5 bileşenden oluşur.
Bileşenler aşağıdaki gibidir:
- Veri kaynakları
- Veri Evreleme
- Veri Ambarı (Veri Depolama)
- Veri Yürüyüşü (Veri Depolama)
- Veri sunumu
Yukarıda sıralanan tüm aşamaları tek tek anlayalım.
# 1) Veri Kaynakları
Veri ambarı sistemlerine girdi görevi gören farklı kaynak sistemleri vardır.
Bu kaynak sistemler şunlar olabilir:
- Herhangi bir kuruluşun günlük işlemlerini kaydetmek için kullanılabilen Oracle, DB2, MySQL, MS Access gibi ilişkisel veritabanları. Bu günlük ticari işlemler ERP, CRM, Satış, Finans ve Pazarlama vb. İle ilgili olabilir.
- Düz dosyalar
- Ağ hizmetleri
- RSS beslemeleri ve benzer kaynaklar.
# 2) Veri Evreleme
Veri kaynakları yerleştirildikten sonra, bir sonraki adım, bu verileri kaynak sistemlerden ambar hazırlık alanına çıkarmak olacaktır.
Veriler, farklı depolama biçimlerini izleyen farklı sistemlerden alındığı için, verileri ortak bir biçime getirmek için yeniden yapılandırmak gerekir. Dolayısıyla, veri dönüşümü bir sonraki adım olarak gerçekleşir.
Dönüşüm sırasında, iş kurallarının uygulanmasını, verileri filtrelemeyi, fazlalık kaldırma, veri biçimlendirme, veri sıralama vb. Dahil olmak üzere veri temizleme gerçekleşir.
# 3) Veri Ambarı (Veri Depolama)
Veriler çıkarılıp dönüştürüldükten sonra, çok boyutlu bir ortama, yani Veri Ambarı'na yüklenecektir. Artık işlenen bu veriler, son kullanıcılar tarafından analiz ve diğer amaçlarla kullanılabilir.
# 4) Veri Martları (Veri Depolama)
Yukarıda belirtildiği gibi, verilerin artık son kullanıcılar tarafından tüketilmeye hazır olduğu, bir sonraki adım olarak isteğe bağlı bir Veri Martları oluşturma süreci vardır. Bu veri reyonları, özel kullanım için belirli bir departmanın veya bir iş kolunun özet verilerini depolamak için kullanılabilir.
Örneğin, Satış, Finans ve Pazarlama vb. departmanlar için, belirli verileri tutan ve bir analistin iş ihtiyaçları için ayrıntılı sorgular gerçekleştirmesine olanak tanıyan bir sonraki adım olarak ayrı veri reyonları eklenebilir. Ayrıca, diğer tüm son kullanıcıların tam depoya erişmesini engeller ve böylece verileri güvenli hale getirir.
dinlendirici web hizmetleri hakkında mülakat soruları
# 5) Veri Erişim Araçları (Veri Sunumu)
Kullanıcılar tarafından veri ambarlarına veya veri reyonlarına erişmek için kullanılabilecek önceden tanımlanmış bir dizi İş Zekası aracı vardır. Bu ön uç araçlar, kullanıcılara verilere erişmek için çeşitli seçenekler sunarak son derece kullanıcı dostu bir şekilde tasarlanmıştır.
Seçenekler aşağıda belirtilmiştir:
- Sorguyu Oracle veya diğer veritabanlarına doğrudan SQL aracılığıyla uygulayarak.
- Rapor oluşturma.
- Uygulama Geliştirme.
- Veri Madenciliği araçlarını kullanma vb.
Piyasada bulunan birkaç popüler depolama aracı şunlardır:
- Analytix DS
- Amazon Redshift
- Ab Initio Yazılımı
- Kod Vadeli İşlemleri
- Bütünsel Veri Yönetimi
- Bilişim Şirketi
Bulut Veri Ambarlama
Veri ambarları dünya tarafından aşırı derecede tanınmaktadır. Ortaya çıkan sonraki soru: Veri Ambarlarını dağıtmak için optimize edilmiş bir yaklaşım kullanıyor muyuz?
Ardından, Kurumsal Veri Ambarlama'ya (EDW) üstünlük sağlayan Bulut Veri Ambarı kullanıma sunuldu. Bulut tabanlı Veri Ambarları kavramı çeşitli avantajlar sunmuştur.
Bunlar aşağıdaki gibidir:
(i) Ölçeklenebilirlik: Bulut sistemlerindeki veriler, geleneksel veri ambarlarında ölçeklendirme yapmak için çok fazla zaman ve kaynak tüketirken, sorunsuz bir şekilde yukarı ve aşağı ölçeklenebilir.
(ii) Maliyet Tasarrufu: Bulut tabanlı veri ambarları, bir ambar kurulumu için gereken yatırımda dikkate değer bir fark yarattı. Maliyetini ortadan kaldırarak toplu ön maliyeti düşürdüler
-
- Donanım / sunucu odalarının bakımı.
- Bakım için gerekli personel.
- Diğer operasyonel maliyetler.
(iii) Performans: Performans, bulut tabanlı sistemlerin geleneksel sistemlere hakim olmasına izin veren başka bir faktördür. İş küresel olarak genişlerse ve verilere dünyanın çeşitli yerlerinden daha hızlı dönüşle erişilmesi gerekiyorsa, bulut tabanlı ambarlar kullanmak en iyisidir.
Massively Parallel Processing (MPP), ambarlar tarafından aynısını elde etmek için kullanılan ortak işleme yöntemlerinden biridir.
(iv) Bağlantı: Yukarıda belirtildiği gibi, verilere birden fazla coğrafi konumdan erişilmesi gerekiyorsa, kullanıcıların bu ambarlara mükemmel bir bağlantıya ihtiyacı vardır ve bulut tabanlı bir ambar da aynı şeyi sunar.
Sonuç
Yukarıdaki makaleyi okuduktan sonra hepinizin Oracle Veri Ambarı sistemi hakkında adil bir fikriniz olduğunu umuyoruz. Veri ambarıyla ilgili belirli bir konu hakkında herhangi bir bilgiye ihtiyacınız olup olmadığını bize bildirin, böylece gelecek eğitimlerde de aynısını ele alabiliriz.
PREV Eğitimi | SONRAKİ Eğitici
Önerilen Kaynaklar
- Veri Gölü Nedir | Veri Ambarı vs Veri Gölü
- Örneklerle Veri Ambarı Test Eğitimi | ETL Test Kılavuzu
- En Popüler 10 Veri Ambarı Araçları ve Test Teknolojileri
- Veri Ambarında Boyutlu Veri Modeli - Örneklerle Eğitim
- Veri Ambarı'ndaki (ETL) Meta Veriler Örneklerle Açıklandı
- ETL Test Veri Ambarı Test Eğitimi (Tam Kılavuz)
- Veri Ambarı Modellemesinde Şema Türleri - Star & SnowFlake Şeması
- Veri Ambarı'nda ETL (Çıkart, Dönüştür, Yükle) İşlemi Nedir?