Modern Data Architecture – Big Data V ..

Bugun Big Datayı anlat dediğinizde en çok kullandığımız Vlerden bahsedeceğim. kimine göre 3 V kimene göre 4 V olarak tanımlanabiliyor. Ben bugunku sartlarda 4V tarafında inananlardanım. Peki Nedir Bu 4 V? VOLUME: DATA AT REST Volume datanın hacmi yani bundan 3-5 sene önce Türkiye'de Gb seviyesinde veresi olan şirketler Giga klupleri olabiliyordu ve sayıları son … Continue reading Modern Data Architecture – Big Data V ..

Hadoop ortamında hangi SQL ne zaman tercih edilmeli

Merhaba arkadaşlar   Big Data , Hadoop ortamında elimizdeki SQL seceneklerini güçlü oldukları alanlar,use caseleri ve essiz yetenekleri anladımda karşılaştırmak istedim.   Apache Hive : SQL in HADOOP Facebook ekibi tarafından yaratılmış , Hadoop ortamında tuttuğumuz datalara standart SQL ile ulaşmamızı sağlayan, raw data file hızlı analiz edebilen, petabyte ölçeğinde bile kendini ispat etmiş , … Continue reading Hadoop ortamında hangi SQL ne zaman tercih edilmeli

Hive and Hbase integration, How to use Hive for Hbase table

Hive ile Hbase database nasil entegre ederim. Hive uzerinden Hbase databasedeki tablomu nasil baglarim   set up necessary path and jar configuration login root user su - hbase shell hbase(main):001:0> list TABLE users   hbase(main):002:0> describe 'users' DESCRIPTION                                          ENABLED 'users', {NAME => 'a', DATA_BLOCK_ENCODING => 'NONE true ', BLOOMFILTER => 'ROW', REPLICATION_SCOPE => '0', VERSIONS … Continue reading Hive and Hbase integration, How to use Hive for Hbase table

Oracle Big Data Appliance incelemesi

Geçtiğimiz günlerde Oracle BDA incelemesi için Oracle'ın organize ettiği Oracle yöneticileri ve blog yazarları etkinliğinde bir araya geldik. Oracle'dan arkadaşlarımız Murat Yeşil, Mehmet Gökmen ve Emrah Uysal sorularımız cevapladı.   Öncelikle bu tarz bir etkinlik düzenlenmesi son derece önemli bu etkinliği düzenliyen Deniz Sağçıya ve ITadvisor dergisi ekibine teşekkürlerimi iletiyorum. Oracle Big data appliance ürününü … Continue reading Oracle Big Data Appliance incelemesi

Data Scientist Kimdir? Data Scientist ne iş yapar? Nasıl Öğrenilir

Merhaba arkadaşlar. Oyun artık değişiyor. Veri her zamankinden daha kıymetli , daha çok ve daha değerli oluyor. Günümüzde insanlar artık gönüllü bir şekilde veri üretiyorlar. Ürettikleri veri doğru analiz edilir ve yorumlarınırsa bundan memnun oluyorlar. Örneğin ben A marka akıllı saat aldığıma çok memnunum. Bu saatin ürettiği kişisel aktivite ve nabız gibi bilgilerimin toplanması ve bana … Continue reading Data Scientist Kimdir? Data Scientist ne iş yapar? Nasıl Öğrenilir

Data Science Data Formats

Veri ile uğraşıyorsanız her türlü data tipine hazırlıklı olmalısınız. Data artık birçok farklı formattan gelebiliyor. Datanın formatını doğru belirleyebilmek son derece önemli oluyor. Bu formatları incelemek gerekirse LOG Files: log fileları büyük projelerde son derece önemli başlık oluyorlar. Log filelarına örnek vermek gerekirse web serverlar, hadoop , sensorler ve cep telefonlarını verebiliriz. Şirketler bu tarz … Continue reading Data Science Data Formats

Spark Day,Istanbul Spark Meetup, TRSUG

Istanbulda düzenlenecek Spark Istanbul Meetup 'da bende konuşmacı olarak yer alacağım. Sınırlı sayıda yer için http://www.eventbrite.com/e/spark-day-tickets-19144747455?aff=linkedin2 Wednesday, November 4, 2015 from 9:00 AM to 5:00 PM (EET) Istanbul, Turkey Ajanda 09:00 – 09:30 Kayıt 09:30 – 09:45 Hoş geldiniz  Şafak Serdar Kapçı, Kora  -   Büyük Veri Mimarı 09:45 – 10:15 Büyük Veride İstatistiğin Önemi Prof. Seniye Ümit Oktay Fırat, … Continue reading Spark Day,Istanbul Spark Meetup, TRSUG

Oracle Open World 2015

I am speaking Oracle Open World at San Francisco below mention subjects. Session ID UGF1723 Title Ten Vital Tips for Oracle Real Application Clusters Performance Abstract In this session, learn about analyzing cache fusion impact in Oracle Real Application Clusters (Oracle RAC), long full-table scans in online transaction processing (OLTP) systems, Automatic Segment Space Management, … Continue reading Oracle Open World 2015

Neden Apache Spark ? Apache Spark Nedir?

Öncelikle Neden Apache Spark sorusuna cevap bulalım. IT dünyasında çözüm olarak Büyük bilgisayarlar dönemini geride bıraktık. Yani daha hızlı processor ve daha fazla memory çözümleri bugunun ihtiyaçlarını karşılayamayacağı ortaya çıkmıştır. Günümüzde Distributed sistemler ön plana çıkıyorlar. Distributed Systemlerde birçok makinadan oluşan bir yapı söz konusudur. Bu yapı iyi gibi gözükmekle beraber datanin merkezi bir yerde durması,çalıştırılma … Continue reading Neden Apache Spark ? Apache Spark Nedir?

Apache Spark, Resilent Distributed Dataset RDD.

Apache Spark is a fast, general engine for large scale data processing on a  cluster. Advantages of Spark High level programming framework Write applications quickly in  Scala, Python or Java. Cluster computing Combine SQL, streaming, and complex analytics Distributed storage Data in memory Easier Development Near real time processing In-Memory Data Storage We can use … Continue reading Apache Spark, Resilent Distributed Dataset RDD.