Google Analytics İzleme

15 Mart 2010

Açık Kaynak ETL Araçları

2000'li yılların basşından itibaren gelişimi hız kazanan ve bir çok işletmede çok önemli işlevleri yerine getiren açık kaynak yazılımlar trendine yeni bir alan daha eklendi. Bu alan açık kaynak veri ayrıştırma , dönüştürme ve yükleme (ETL- extract, transform , load) bütünleştirici yazılımları. 

Bu yazılımlar özellikle orta boy ve büyük işletmelerde hem kendi kodunu geliştirme ihtiyacını azaltmakta , hem de mevcut ticari ürünlere göre düşük sahip olma maliyeti avantajı sağlamaktadır.


ETL çalışma prensibi oldukça basittir: Verileri al, işe özgü veri dönüşüm mantığını verilere uygula ve hedef platforma gönder.





Kurumsal düzeyde pazarda, Ab Initio, Business Objects, IBM, Informatica ve SAS ürünleri bulunmaktadır. Bu söz konusu firmalara ait çözümler, heterojen platformlarda, yüksek miktarlardaki, çoklu veri dönüşümü ve alışverişini, yüksek perfomrans ile gerçekleştirebilecek şekilde dizayn edilmiş ve geliştirilmiştir. Bu çözümlerin fiyatları 50.000 ile 100.000 USD arasında değişmektedir. 


Yukarıda belirttiğimiz firmaların çözümlerinin yanında, heterojen platformlar için kısıtlı destek imkanı sunan, ancak daha düşük maliyetli çözümlerde pazarda bulunmaktadır. Örneğin Microsoft SQL Server ile paket olarak gelen SQL Server Integration Services bu tarz bir üründür, ancak yalnızca Microsoft SQL Server bağlantısı kurabilmektedir. Yine benzeri bir ürün Oracle Warehosue Builder , Microsoft çözümünden daha gelişmiş bir platform desteği sunmaktadır ve tabi öncelik doğal olarak Oracle veritabanı sistemleridir. Buna ek olarak çeşitli CRM ve ERP uygulamalarına bağlantı seçeneği de, müşterilere belirli bir ücretle sunulmaktadır. 

IBM'in Websphere Message Broker çözümü yine ETL işlevleri içermesi açısından bu sınıfın içerisine dahil edilebilir. Her ne kadar daha çok SOA ve EAI için düşünülmüş çok güçlü bir altyapıya sahip araç olsa da, sunduğu heterfojen platform desteği, çeşitli bağlantı adaptörleri , veri transformasyon araçları ve desteklediği mesajlaşma altyapısı ve endüstriyel standartlar ile ETL içinde bir çözüm olarak görülebilir. Tabi ki yüksek sahip olma maliyeti gözden kaçmamalıdır. 

Bu pazar dinamikleri içerisinde, büüyük ölçekli verilerle çalışma zorunluluğu olan kurumlar için, farklı veri kaynaklarından gelen verilerin bütünleştirilmesi ve farklı hedeflere yönlendirilmesi gibi ödevlerin düşük maliyetler ile gerçekleştirilmesi, oldukça büyük bir çaba gerektirir. Bir yandan bu tarz bir entegrasyon aracını satın almak ya da kendi IT yapısı içerisinde işe uygun çözümü geliştirmek, kullanılan kaynak miktarı ile bağlantılı olarak maliyetli çözümlerdir. 

Bu noktada açık kaynak modeli gerçek bir alternatif olarak ortaya çıkmaktadır :
  • Geniş Destek İmkanı - Dünya üzerine dağılmış bir çok geliştirici birbirlerinden bağımsız olarak geliştirdikleri , bir çok değişik işlevi yerine getiren adaptörleri , yine topluluk üzerinden tüm dünyaya dağıtıyor. 
  • Gelişmiş Endüstri Standartları: Verilerin dönüştürülmesinde, veri formatları ve standartları çok önemli bir rol oynamaktadır.XML, SWIFT , EDIFACT gibi standart formatların desteklenmesi, doğrulanması ve dönüştürülmesi , etkin bir bir sistem için gereklidir. Açık kaynak kodlu projelerdeki, geniş geliştirici ve kullanıcı desteği bu standartların desteklenmesi, geliştirilmesi ve kodun testi açısından büyük avantajlar sağlar. 
  • Daha az maliyet: Şu anda pazarda bulunan açık kaynak kodlu ETL çözümleri, ticari ve kapğalı kodlu ürünlere göre çok düşük sahip olma maliyeti ile önemli avantaja sahiptirler. Dileyen kurumlar, gerekli altyapı ve bilgi sahibi iseler, bu açık kaynak kodlu paketleri indirip gerekli değişiklşik vezya ekleri kendileri yaparak da bu yazılımları kullanabilirler. 



MEVCUT AÇIK KAYNAK KODLU ETL ÇÖZÜMLERINDEN BAZILARI



http://www.cloveretl.org/_img/logo_clover.gif

clover.ETL

Java teknolojisi kullanmasından dolayı platform bağımsızdır. Tek başına (standalone) kullanılabileceği gibi , sunucu tarafında da (server application) olarak da kullanılabilir . Transfoırmasyon kütüphanesi olarak, kendi uygulmaanıza eklemeniz mümkündür. Hem ticari hem de LGPL lisansı ile dağıtılır. GUI ticari lisans ile beraber gelmektedir , ticari olmayan amaçlar içinde kullanmak mümkündür. 


http://www.cloveretl.org/

KETL

KETL Java bazılı mimariye sahip bir araçtır ve Kinetic Network firması tarafından finanse edilen bir projedir. Çekirdek kütüphane LGPL lisansı ile gelirken , KETL sunucusu GPL lisansı altında dağıtılmaktadır. Şu anda geliştirme işlemi çoğunlukla Kinetics firması çalıçanları tarafından yapılmaktadır , yakın gelecekte firma dışından da geliştiricierin katılımı beklenmektedir. 

KETL, XML tabanlı bir geliştirme metoduna sahiptir. Bu amaçla Eclipse IDE ortamı kullanmak mümkündür. Kendi takvim-zaman planlama ve olaya-dayalı job çalıştırma desteği, performans izleme , job istatiskleri gibi özelliklere sahiptir. 

http://www.ketl.org/

Pentaho Kettle

BI - Business Intelligence alanında uzmanlaşmış Pentaho firması, veri entegrasyon işlevine sahip bir ETL aracı sunmaktadır. ETL işlevi , LGPL lisansı ile dağıtılan Kettle projesi bazlıdır. 

Pentaho Kettle projesi bağlantı adaptörleri, yığın verileri yükleme (bulk loader) ve dönüştürücüler konusunda, topluluk tarafından birçok ek geliştirme ile desteklenmiştir. Bunlara örnek olarak Oracle Bulk Loader, Web Services Look up ve SAP Connector verilebilir. Kettle ile entegre olmasına rağmen SAP Connector bir plug-in olarak ücretli olarak, Pentaho partneri olan Proratio tarafından sunulmaktadır. 

http://www.pentaho.com/products/data_integration/



Talend - open data solutions - Talend is the first provider of open source data integration software

Talend

Pazara yeni giren bir Fransız firması olan Talend, kendisine hedef olarak açık kaynak kodlu veri integrasyonunu koymuş ve buna istinaden pazarda Open Studio ürünü ile pozisyon almıştır. GPL v2 lisansı ile dağıtılmaktadır , ancak Open Studio işlevlerini kendi ürünlerinde kullanmak isteyen firmalara yönelik OEM lisanslama seçeneğine de sahiptir. Örneğin JasperSoft , Pentaho ile rekabet etmek amacıyla Open Studio'yu , kendi açık kaynak kodlu BI çözümüne entegre etmiştir. Talend, bir açık kaynak sağlayıcısı olarak eğitim, destek ve danışmanlık hizmetleri ile kazanç hedeflemektedir. 

Open Studio, kullanıcılar için Eclipse tabanlı oldukça kullanışlı bir IDE ortamı sunmaktadır. 


Alıntıdır: http://aciknokta.blogspot.com/2008/07/ak-kaynak-etl-aralar.html

Hiç yorum yok: