Dokuz Açık Kaynak Kodlu Büyük Veri Aracı - IHS Blog

Dokuz Açık Kaynak Kodlu Büyük Veri Aracı

Sadece Hadoop büyü veri aracı değildir. Hadoop’tan başka açık kaynak kodlu pek çok Büyük Veri platformu bulunmaktadır. Apache Hadoop’un adını zikretmeden Büyük Veriden bahsetmek mümkün değildir. Fakat Hadoop …

Büyük Veri

Sadece Hadoop büyü veri aracı değildir. Hadoop’tan başka açık kaynak kodlu pek çok Büyük Veri platformu bulunmaktadır.

Apache Hadoop’un adını zikretmeden Büyük Veriden bahsetmek mümkün değildir. Fakat Hadoop giderek gelişen Büyük Veri ekosisteminin küçük bir parçasını oluşturuyor. Başka birçok Büyük Veri platformu ve aracı var ve bunların çoğu açık kaynaklı.

Neden Büyük Veri projelerininin pek çoğunun açık kaynak kodlu olduğuna dair kesin bir cevap yok. Büyük bir olasılıkla Hadoop projesinin Büyük Veri projesinin lokomotifi olmasından. Hadoop açık kaynak kodlu, Hadoop’la çalışanların çoğu da açık kaynak camiasında oldukça aktif olduğu için bu kişilerin geliştirdiği araçlar da genellikle açık kaynaklıdır.

Büyük Veri projelerinin bu kadar hızlı benimsenmesinin nedeni biraz da gerekli yazılımların açık kaynaklı olması ve departman veya çalışan seviyesinde dahi kolayca indirilebilip kullanılabilmesidir.

Nedeni ne olursa olsun, Büyük Veri kuruluşlara büyük fayda sağlamakta. Büyük Veri yazılım araçlarına ücretsiz olarak ulaşılabilir. Ayrıca şirketler lisans için ücret ödemek yerine, gerekirse kendi özel gereksinimlerine uygun açık kaynak kodları satın alabilirler.

Şu an piyasada bulunan açık kaynak kodlu araçların çeşitliliği hayret verici seviyededir. Biz en gözde ve yenilikçi iki alana göz atacağız: Büyük Veri platformları ve Büyük Veri aramaları.  

Büyük Veri Platformları

Lumify Büyük Veri’nin birleştirilmesi, analizi ve gösterimi için görece yeni bir açık kaynak kodlu projedir. Web tabanlı arayüzü ile veriniz içindeki bağlantıları ortaya çıkaran analiz seçenekleri, 2D ve 3D çizge gösterimleri, tüm teksti çok boyutlu arama, dinamik histogramlar, etkileşimli coğrafik haritalar gibi özellikler içerir.

Talend Open Studio for Big Data sizin Hadoop ve NoSQL veri tabanları ile çalışabilmenizi sağlar. Hadoop’un gücünden tam olarak faydalanmak için basit grafiksel araçlar ve yerli kod üreten sihirbazlar içerir.

HPCC Systems Big Data Büyük Verinizin manipülasyonu, dönüştürülmesi, sorgulanması ve saklanması için Hadoop’a alternatif olarak geliştirilmiş bir platformdur. Thor veri düzeltme, Roxie veri sorgulama/dağıtma motoru ve ECL (Enterprise Control Language) kullanır.

Apache Storm  sınırsız veri dizesini dağıtık gerçek zamanlı hesaplama sistemi içerisinde güvenli olarak işleyebilmenizi sağlar. Hadoop’un toplu işleme (batch processing) için yaptığını gerçek zamanlı olarak (real-time processing) yapar.

Apache Drill  Büyük Veri incelemesi için kullanılan bir SQL sorgulama motorudur. Tamamen modern Büyük Veri uygulamalarından gelen yarı yapısal ve hızla değişen veride yüksek performanslı analizi destekleyecek şekilde tasarlanmıştır. Drill mevcut Apache Hive ve Apache HBase dağıtımlarıyla anında entegrasyon imkanı sunar.

Apache Samoa  (Scalable Advanced Massive Online Analysis) Büyük Veri akışı madenciliği içindir. Dağınık ML algoritmaları için bir programlama soyutlaması içeren dağınık bir ML (machine learning) çerçevesidir.

Ikanow biraz farklıdır. Dünyanın ilk yapılandırılmamış güvenlik analizi platformu olma iddiasındadır. Ücretsiz sürümü yapılandırılmamış ve yapılandırılmış veriye erişim sağlar ve açık, kendi kendini destekleyen bir platform kapsamında arama, veri widgetları ve dışarı aktarım özelliklerine sahiptir.  

Özel Büyük Veri Arama Araçları

Apache Solr oldukça güvenilir, ölçeklendirilebilir, hata toleranslı olacak şekilde tasarlanmış, dağınık dizin, kopyalama ve yük dengeli sorgulama, otomatik yük üstlenme ve hata giderme, merkezi konfigürasyon gibi özelliklere sahip bir araçtır.   

Solr dünyanın en büyük internet sitelerinin birçoğuna arama ve navigasyon özelliklerini verir ve Apache Lucene’in Java tabanlı endeksleme ve arama teknolojisi üzerine kuruludur.

Elasticsearch dağınık ve açık kaynak kodlu bir arama ve analiz motorudur. Ölçeklenebilme, güvenlik ve kolay yönetim için tasarlanmıştır. Yapısal ve yapısal olmayan ve zamana dayalı veriyi tasarlamak için kullandığı geliştirici dostu sorgulama dili sayesinde hızlı arama ve güçlü analiz yapma olanakları sunar.

Etiketler

Bir Cevap Yazın