Oracle’ın Big Data ile ilgili ürünlüleri gelişerek devam ediyor. Bu ürün serisinin son parçası Big data discovery.
Hadoop’un görsel yüzü olarak açıklanan ürünü inceleme fırsatı buldum. Çok önemli özellikleri olduğunu ve süreçleri kısaltmada inanılmaz işe yarayacağını düşünüyorum.
Bugün 10 milyarın üzerinde internete bağlanmış cihaz var. Bilgisayar,tablet mobil telefon giyebilir teknolojiler saatler gözlükler araç içi sistemler. Hepimizin tahmin edebileceği üzerine bu cihaz sayısı önümüzdeki yıllarda çok hızlı artış gösterecek. Durum böyle olunca üretilen veri miktarıda inanılmaz bir artış gösterecektir.
Bir BI projesinin belirli safhaları vardır. Biz bu safhaları
İhtiyaçları belirleme,datayı elde etme,datayı anlama,Datayı kullanılabilir hale getirme,analiz etme ve sonuc çıkarma olarak belirleyebiliriz. Bu süreçlerin herbiri başlı başına önemlidir ve zamanımızı alır.
Bir Big Data projesinde ise aynı safhalar olmasına rağmen veriyi elde ederken,datayı anlarken ve manipule ederken çok masraf yaparız. Asıl olan veriden bir sonuç çıkarmak iken verinin hazırlık aşamaları verinin analiz aşamaşının kat ve kat üstünde zamanımız alır.
Oracle bu rakamı %80 hazırlık %20 analiz olarak açıklıyor. Big data konusundaki çalışmalarınıda bu noktada yoğunlaştırıyor. bu yüzdeleri tersine çevirmek için uğraşıyor. Hazırlık aşamasında %20 analiz aşamasında %80 zaman harcamamız için çok daha hızlı işlenen datalar otomatikleştirilmiş işlemler,kullanıcı dostu programlar çıkartıyor.
Oracle Big Data discovery find,explore,transform,discover ve share aşalamalarından oluşuyor. Find aşamasında projelerimizi ve datasetlerimizi görüyoruz.
Explore aşaması data tipleri ve data değerlerini kolayca anlamamız için hazırlanmış durumda. Sıralama işlemleride bu aşamada çok önemli bir özellik
Transform aşamasında datayı dönüştürme ,temizleme,çevirme,gruplama gibi bütün önemli özellikleri gerekli kopyalarını alarak gerçekleştirebiliyoruz.
Discover aşaması datayı her detayı ile incelediğimiz aşama
Publish ve Share aşamasında oluşturduğumuz veriyi dışarıya çıkarttıp ecosistemde Hive, R veya Oracle Big data SQL ile üzerinde çalışılmasını sağlayabiliriz.
Oracle Big Data Discovery veri atmamızda olçukça kolay. Attığımız bu verilemiz indexlemeye ve her türlü hızlı aramaya uygun hale geliyor.
Özetle söylemek gerekirse Oracle Big Data Discovery sayesinde veriyi hazırlama aşamalarımızda çok ciddi zaman kazanacağız.
kaynak. Oracle.
Değerli paylaşımınız için teşekkür ederim, yararlı bir konu.