Hive and Hbase integration, How to use Hive for Hbase table

Hive ile Hbase database nasil entegre ederim. Hive uzerinden Hbase databasedeki tablomu nasil baglarim   set up necessary path and jar configuration login root user su - hbase shell hbase(main):001:0> list TABLE users   hbase(main):002:0> describe 'users' DESCRIPTION                                          ENABLED 'users', {NAME => 'a', DATA_BLOCK_ENCODING => 'NONE true ', BLOOMFILTER => 'ROW', REPLICATION_SCOPE => '0', VERSIONS … Continue reading Hive and Hbase integration, How to use Hive for Hbase table

Oracle Big Data Appliance incelemesi

Geçtiğimiz günlerde Oracle BDA incelemesi için Oracle'ın organize ettiği Oracle yöneticileri ve blog yazarları etkinliğinde bir araya geldik. Oracle'dan arkadaşlarımız Murat Yeşil, Mehmet Gökmen ve Emrah Uysal sorularımız cevapladı.   Öncelikle bu tarz bir etkinlik düzenlenmesi son derece önemli bu etkinliği düzenliyen Deniz Sağçıya ve ITadvisor dergisi ekibine teşekkürlerimi iletiyorum. Oracle Big data appliance ürününü … Continue reading Oracle Big Data Appliance incelemesi

Data Scientist Kimdir? Data Scientist ne iş yapar? Nasıl Öğrenilir

Merhaba arkadaşlar. Oyun artık değişiyor. Veri her zamankinden daha kıymetli , daha çok ve daha değerli oluyor. Günümüzde insanlar artık gönüllü bir şekilde veri üretiyorlar. Ürettikleri veri doğru analiz edilir ve yorumlarınırsa bundan memnun oluyorlar. Örneğin ben A marka akıllı saat aldığıma çok memnunum. Bu saatin ürettiği kişisel aktivite ve nabız gibi bilgilerimin toplanması ve bana … Continue reading Data Scientist Kimdir? Data Scientist ne iş yapar? Nasıl Öğrenilir

Data Science Data Formats

Veri ile uğraşıyorsanız her türlü data tipine hazırlıklı olmalısınız. Data artık birçok farklı formattan gelebiliyor. Datanın formatını doğru belirleyebilmek son derece önemli oluyor. Bu formatları incelemek gerekirse LOG Files: log fileları büyük projelerde son derece önemli başlık oluyorlar. Log filelarına örnek vermek gerekirse web serverlar, hadoop , sensorler ve cep telefonlarını verebiliriz. Şirketler bu tarz … Continue reading Data Science Data Formats

Spark Day,Istanbul Spark Meetup, TRSUG

Istanbulda düzenlenecek Spark Istanbul Meetup 'da bende konuşmacı olarak yer alacağım. Sınırlı sayıda yer için http://www.eventbrite.com/e/spark-day-tickets-19144747455?aff=linkedin2 Wednesday, November 4, 2015 from 9:00 AM to 5:00 PM (EET) Istanbul, Turkey Ajanda 09:00 – 09:30 Kayıt 09:30 – 09:45 Hoş geldiniz  Şafak Serdar Kapçı, Kora  -   Büyük Veri Mimarı 09:45 – 10:15 Büyük Veride İstatistiğin Önemi Prof. Seniye Ümit Oktay Fırat, … Continue reading Spark Day,Istanbul Spark Meetup, TRSUG

Oracle Open World 2015

I am speaking Oracle Open World at San Francisco below mention subjects. Session ID UGF1723 Title Ten Vital Tips for Oracle Real Application Clusters Performance Abstract In this session, learn about analyzing cache fusion impact in Oracle Real Application Clusters (Oracle RAC), long full-table scans in online transaction processing (OLTP) systems, Automatic Segment Space Management, … Continue reading Oracle Open World 2015

Neden Apache Spark ? Apache Spark Nedir?

Öncelikle Neden Apache Spark sorusuna cevap bulalım. IT dünyasında çözüm olarak Büyük bilgisayarlar dönemini geride bıraktık. Yani daha hızlı processor ve daha fazla memory çözümleri bugunun ihtiyaçlarını karşılayamayacağı ortaya çıkmıştır. Günümüzde Distributed sistemler ön plana çıkıyorlar. Distributed Systemlerde birçok makinadan oluşan bir yapı söz konusudur. Bu yapı iyi gibi gözükmekle beraber datanin merkezi bir yerde durması,çalıştırılma … Continue reading Neden Apache Spark ? Apache Spark Nedir?

Apache Spark, Resilent Distributed Dataset RDD.

Apache Spark is a fast, general engine for large scale data processing on a  cluster. Advantages of Spark High level programming framework Write applications quickly in  Scala, Python or Java. Cluster computing Combine SQL, streaming, and complex analytics Distributed storage Data in memory Easier Development Near real time processing In-Memory Data Storage We can use … Continue reading Apache Spark, Resilent Distributed Dataset RDD.

Hadoop Nedir? Mapreduce Nedir?

Hadoop'un başlangıcı 1990ların sonu 2000lerin başında Google çalışmalarına gidiyor. Google 2003 senesinde Google File Sistemini çıkarıyor. 2004 yılında Map Reduce ortaya çıkıyor. Ana prensipleri Developerlar'ın network programlamasında çok uğraşmamaları, Developerların nodeların birbiri ile konuşmaları için minimum uğraşmaları,Nodeların birbiri ile minimum haberleşmeleri, Datanın kopyalanması sayesinde hem kullanılabilirlik hemde ulaşılabilirlik artacaktır. Hadoopda datayı sisteme yüklediğimizde bloklara ayırarak … Continue reading Hadoop Nedir? Mapreduce Nedir?

What is Yarn?

YARN is a Yet Another Resource Negotiator. Yarn goal is to facilitate applications to achieve 100% utilization of all resources on the physical system while letting every application execute at its maximum potential. YARN multi node cluster has an aggregate pool of computer resources memory and cpu.  YARN uses scheduler policy. Compare Hadoop 1 & YARN. … Continue reading What is Yarn?