Oracle Big Data

Big Data nedir? Big data hacimli yapılandırılmamış verilerden oluşur. Farklı veri kaynaklarından veriler big dataya girer.
Farklı kaynaklarımız sosyal medya,bloglar,bazı finans ve banka verileri,log verileri,e ticaret servisleri gibi örneklendirilebilir.
Geneleksel veritabanlarıda tutulmayan bu tarz veriler akıllı telefonların devreye girmesiyle günden güne çoğalmaktadır.
Genel olarak big data yı 4 V den oluştuğunu söyleyebiliriz.

Volume (Hacim):Verinin hacmi.Günden güne büyüyen veri
Variety (Çeşitlilik): Çok çeşitli kaynaklardan gelen verilerin analiz edilmesi ve işlenmesi
Velocity (Sürat): Hacmi artan verinin sisteme aktarılması
Value (Değer): Diğer 3 vnin toplamından oluşur diyebiliriz.

Verinin dönüştürülmesi 4 aşamalı bir süreçten geçiyor
Acquire:Raw datanin HADOOP ve NOSQL kullanılarak elde edilmesi
Organize:Map reduce kullanarak datanın rafine edilmesi
Analyze:Analise uygun hale getirme
Decide:iş verisine dönüştürme. Verinin dönüştürüldüğü bu dört aşama tek bir makinada olmaz. İlk iki aşama için Oracle Big data appliance kullanabiliriz.

Acquire aşamasında HADOOP,NOSQL ,ORACLE OLTP
Organize aşamasında ODI,Cloudera CDH,OLH
Analyze aşamasında Oracle DW,Oracle Analytics data mining R spatial,OBİ kullanılabilir.

Oracle Big data appliance nedir?

Oracle Big data appliance bir engineered sistemdir. Yani Hardware ve Software üzerinde beraberce barındırır.Cloudera chd ve Oracle Nosql database barındırır.Acquire ve Organize aşamalarını kapsayabilir.
Hardware özellikleri

– 18 tane Sun X4270 M2 makina
– 48 GB memory her makinada
– 12 Intel core her makinada
– 24 TB storage her makinada

Software özellikleri

– Oracle NoSQL database
– Oracle Big data connector
– Open Source R
– Cloudera Management&Cloudera’s Distribution including Apache Hadoop
– Oracle Linux 5.6  and Java Hotspot VM

Oracle Big data connector sayesinde big datayla Oracle database arasında çalışabilir.

Oracle Direct Connector for HDFS
Oracle Loader for Hadoop
Oracle Data Integrator Application Adapter for Hadoop
Oracle R Connector for Hadoop

Hadoop distributed file system nedir?
Hadoop HDFS yi büyük datafileları küçük chunklar halinde tutar ve makinalar arası kopya yapar.

Oracle NOSQL database nedir?
Key value databasedir.Berkeleydb java editiondan doğmuştur.Key valuelar parcalar halinde makinalara dağılmış ,kopyalanmıştır.

Oracle exadata ile Oracle Big data appliance arasında bağ varmıdır.

Oracle big data appliance acquire ve Organize aşamasında çalışmaktadır. Araya konulan infiniband sayesinde Oracle Exadatayı Analyze ve decide kısmında kullanabiliriz.
Oracle Exalytics te bu aşamada Exadata ile beraber görev yapabilir.

Bir sonraki yazımda HADOOP nedir konusunda olacak.