Hadoop Eğitimleri, Big Data Eğitimleri, Spark Eğitimleri

Yeni Nesil Datawarehouse . Apache Hive LLAP ile çok daha hızlı Interactive Query , Impala mı Hive mı?

Merhaba arkadaşlar. Hadoop platformu içerisinde çıktığı ilk günden bu yana en önemli servislerden biri Hive dersek yanılmamış oluruz. Hive bugune kadar bir çok şirkette modern Datawarehouse yapılanmasında inanılmaz avantajlar sundu. Kimi zaman performans sorunları ile eleştiriler olsada Hive 'ın tune edilebileceğini ve bu tuning işleminin inanılmaz önemli farklar yarattıgını söylemek lazım. Türkiye'de TBlarca veriyi hive [...]

AWS servisleri ile Big Data (Kinesis, Lambda, Elasticsearch,Kibana)

Sevgili Dostlarım Big Data üzerinde bütün Cloud servis sağlıyacalarının sahane çözümleri ile karşı karşıyayız. Bu yazımda Amazon AWS nin bir takım önemli ürünlerinden bahsedeceğim. Bu yazımda AWS servislerinin hepsini ele almam mümkün değil onlar hakkında da yakında açıklamalar yapmaya çalışacağım. Bir sonraki yazı Google ve Oracle üstüne olacak.  Kendime göre hangi teknolojiyi neden tercih etmemiz [...]

Python dili Collection Data typeları

Gerek Data Science eğitimlerinde , Yapay zeka çalışmalarında hatta klasik database yönetiminde python dili son derece önemli. Hazır sağladığı paketleri kullanım ve öğrenim kolaylıkları ile beraber en iyi diller arasında sürekli yükselişte. Python dili ile ilgili birbirine benzeyen ama dikkat edilmesi gereken ufak bir detay paylaşmak istiyorum. Collection data typelarında List deneme = ['guzel','iyi','super','kotu','berbat'] derece [...]

Apache Spark ile Oracle Database ine bağlanma ve sorgu çekme.

  Big data teknolojileri içerisinde Apache Spark son derece önemli bir yer tutuyor. Apache ile neler yapabileceğimiz konusunda  linki tıklayabilirsiniz. Bugun Spark üzerinden Oracle Database imize nasıl bağlanabiliriz , oradaki verileri alıp ne şekilde kullanabiliriz. bir örnekle paylaşmak istedim. Makinamızda Hadoop platformunun yüklü olduğunu ve spark servisinin olduğunu varsayıyorum. Spark kurulumunu http://spark.apache.org/downloads.html gerçekleştirebilirsiniz.     orcl isminde [...]

Data Scientist Nedir ? Nasıl Data Scientist olunur ? Data Scientist olmak için öğrenilmesi gerekenler

Data Scientist Kimdir? Bir kaç farklı tanımı var ama en beğendiğim bir iki tanımlamayı buraya yazmak istedim. What is Data science? 'Building software products (aka data products) whose core functionality relies on applying statistical or Machine learning methods to data.' What is Data scientist? A person who do above Bir başka önemli Linkedin mensubu Rogati [...]

Data Scientist Nasıl olunur? How to become a data scientist . Veri Bilimci olmak için yapılması gerekenler.

Data Scientist olmak için neler yapmalı? Arkadaşlar bildiğiniz gibi data scientist çağımızın en önemli IT işlerinin başında geliyor. Çoğumuz bu konularda bir dönüşümün içine giriyoruz. Bu dönüşüm ve gelişim süreçini başarı ile atlatmak ve fark yaratmak için yapılması gerekenleri kendime göre özetledim. 1-SQL,Istatistik,matematik ve machine learning konularında kendinizi geliştirerek 2-Python ve R temelleri ve ilgili [...]

NoSQL nedir? Nosql & Rdbms karsilastirmasi.

Merhaba arkadaşlar Öncelikle verileri hangi amaçla kullanacağımıza karar verelim. İki temel kullanım yöntemini inceleyelim. 1-Analitik kullanım Amaç geleceğe doğru yapacağımız seçimler ise batched olarak gelen veriler , son derece büyük veriler üzerinden yapılan hesaplamaları analitik olarak değerlendirebiliriz. 2-Operasyonel kullanım Amaç anlık (şuan) ise gerçek zamanlı çalışmalar data flowlar ve datanın process edilmesi ise çok hızlı [...]

Big Data ile Sektörel Çözümler Semineleri (Ücretsiz)

Arkadaşlar selamlar. Big data ile ilgili yaptığımız projeler ve yeni gelişmelerin sektörünüze ne yenilikler getirdiği konusunda ücretsiz seminerler düzenliyoruz. Sigortacılık,Telekom,Finans,Üretim,Sağlık sektörleri başta olmak üzere aşağıda konu başlıklarını bulabilirsiniz. İlginizi çeken konu başlığı konusunda bana zekeriyab@bilginc.com adresinden ulaşabilirsiniz. Seminer süresi 1-2 saat cıvarında ve uygulamalı olacaktır. Delivering Data-Driven Transformations in Insurance (Sigortacılık) Business Critical Architecture for [...]

Nosql database nedir? HBASE Nedir? COUCHBASE nedir?

Merhaba arkadaşlar, Günümüz dünyasında ilişkisel veritabanı modellerinin birbirinin neredeyse aynısı olduğu söylemek mümkün. Örneğin bir Mysql database ile Oracle database arasında Rdbms olarak bir fark olduğu söylemek son derece güç genelde farkın güvenlik , performans ve veri büyüklüğü karşısında Cluster çalışma mantığından geldiğini söyleyebilirim. RDBMS konusunda bence en iyi database pazardan da anlaşılacağı Oracle dır. [...]

Hortonworks Certified Administrator Exam. HDPCA

Hi Friends,     Glad to inform you I successfully pass Hortonworks Certified Administrator exam. HDPCA Certification Overview Hortonworks has redesigned its certification program to create an industry-recognized certification where individuals prove their Hadoop knowledge by performing actual hands-on tasks on a Hortonworks Data Platform (HDP) cluster, as opposed to answering multiple-choice questions. The HDP [...]