DevVeri.com

Boğulacaksan büyük veride boğul!

Nosql

Elasticsearch İle Metin İşleme

Bu yazıda, popüler doküman veri tabanlarından Elasticsearch (ES) ile metin işleme ve sorgulama konusunda bazı önemli noktaları sizlerle paylaşmak istiyorum. Java da yazılmış olan açık kaynak kodlu metin arama motoru olan Apache Lucene kullanılarak geliştirilen Elasticsearch, rakibi Apache Solr ile ciddi bir rekabet içinde. Bu yazı Türkçe kaynaklarda fazlaca değinilmediğini düşündüğüm, Elasticsearch ile metin verisinin […]

, ,

MongoDB Replica Set Kullanımı

MongoDB, şüphesiz son 5 yılın en iyi NoSQL veritabanı çözümlerinden bir tanesi. Foursquare gibi büyük firmalar tarafında kullanıldığı öğrenilince, insanlar kendi sistemlerinde ciddi veri saklama çözümleri için bir heyecanla MongoDB kullanmaya çalışıyor. Evet MongoDB bir çok alanda veri saklama işinde çok yararlı olabilir, ama inanın yanlış kullanıldığı takdirde sizin bir numaralı kabusunuz da olabilir…. MongoDB […]

, ,

NoSQL’in Kısa Tarihi

1 NoSQL’in kısa tarihi 1.1 Eski Güzel Günlerin Bitişi Eskilerin geçmişi “ah o eski güzel günler” diye andığını ve yeniler için ise “o eski güzel günlerin” henüz gelmediğini bilerek yaşadığımızda, her yeni oluşumun kendine has güzellikleri ile geldiğini de bilmeliyiz. Bilgi teknolojileri dünyasının eski güzel günlerinde, eldeki problemin çözümü için gerekli olanlar az sayıda seçenek […]

, , ,

Pig üzerinden Hadoop ile MongoDB Entegrasyonu

Açık kaynaklı büyük veri teknolojilerinin en beğendiğim özelliği, birden fazla projeyi birlikte kullanabilmek. Bu sayede, farklı projelerin güçlü olduğu taraflardan faydalanarak ortaya daha büyük bir değer çıkartmak mümkün oluyor. Bu yazıda MongoDB ile Hadoop‘u Pig üzerinden entegre ederek nasıl kullanabileceğimize bir örnek vermeye çalışacağız. Hazırlık MongoDB’nin geliştirdiği connector sayesinde, MongoDB’deki verileri Hadoop üzerine taşımak ya da […]

, , ,

Introduction to MongoDB

Harun Yardımcı’nın hazırladığı MongoDB ile ilgili sunuma buradan ulaşabilirsiniz: Introduction to Mongodb from Harun Yardimci

,

Apache Cassandra Astyanax

Astyanax, Java ile geliştirilmiş bir Apache Cassandra istemci kütüphanesidir. Netflix tarafından geliştirilmiş ve halen kullanılmaya devam etmektedir. Bu sebeple sık sık yeni geliştirmeler yapılmakta ve problemleri hızlıca çözülmektedir. Astyanax’ın öne çıkan özelliklerini Thrift API’si ile uğraşmadan daha yüksek seviyeden, arayüz (interface) tabanlı, nesne yönelimli tasarıma sahip bir yapı ile Cassandra erişimi, istemci tarafında hata kontrolü ve […]

, ,

Apache Cassandra Kurulumu

 Bu yazıda Apache Cassandra kurulumundan ve temel bazı araçların kullanımından bahsedeceğiz. Öncelikle Cassandra’yı indirmekle başlayalım, resmi sitesinden en son sürümü indirebilirsiniz. Şu anda en güncel sürüm 1.1.1 olarak görünüyor. Ben bu tip uygulamaları /usr/java ya da /opt dizini altına kurmayı tercih ediyorum. Bu yazıda /usr/java dizinine kuracak şekilde anlatacağım. İndirdiğim apache-cassandra-1.1.1-bin.tar.gz dosyasını /usr/java dizini altına açtıktan […]

,

MongoDB ile MapReduce Kullanımı

MongoDB document-oriented mimariye sahip NoSQL veritabanıdır. MongoDB üzerinde bildiğimiz klasik veritabanlarındaki gibi tablo yapısına sahip değil. Verilerimizi BSON(Binary JSON) şeklinde tutuyor. Tablo yapısı yok onun yerine collectionlar mevcut. (bkz: MongoDB NoSQL Veritabanı) MongoDB üzerinde MapReduce işlemleri javascript ile yapılmaktadır. Klasik veritabanlarındaki count, sum, having gibi işlemleri yapmak için MongoDB üzerinde MapReduce kullanıyoruz. (bkz: MapReduce Nedir?) Örnek product collectionında bulunan verilerim aşağıdaki […]

, ,

Java JPA ile MongoDB Kullanımı

Java ile MongoDB’yi kullanmak için bir çok yöntem mevcut, bunlardan birisi JPA üzerinden erişim. Hali hazırda JPA kullanıyorsanız veya NoSQL konusunda yeniyseniz bu yöntemi tercih edebilirsiniz. MongoDB’nin JPA erişimini Datanucleus kütüphaneleri üzerinden kullanıyoruz. Datanucleus ismini özellikle GAE (Google App Engine) üzerinde uygulama geliştirenler bileceklerdir, GAE üzerinde veritabanı olarak Big Table kullanılıyor ve erişim de JPA […]

, , ,

MongoDB NoSQL Veritabanı

MongoDB döküman tabanlı bir NoSQL veritabanı sistemidir (bkz: NoSQL nedir?). MongoDB yapısal verileri JSON benzeri dökümanlarlarda (BSON = Binary JSON) tutar. Her türlü sorgulama ve yönetim işleri JavaScript formatında yapılır. MongoDB  2007 yılında 10gen firması tarafından geliştirilmeye başlandı. Şu anda 2.0.5 sürümüyle oldukça stabil hale gelmiş durumda ve foursquare, Craigslist, MTV Networks gibi birçok büyük firma tarafından ciddi şekilde […]

, ,

MongoDB’de Sharding

Sharding, büyük miktarda veriyi yönetebilmek amacıyla parçalara ayırmak ve bu parçalar üzerinden kullanmak diyebiliriz. MongoDB’nin güzel özelliklerinden birisi de sharding kabiliyeti. MongoDB’de shard yapabilmek için mongos, config server ve shard’lara ihtiyaç vardır. Shards İçinde datayı barındıran mongod processleridir. Mongos’un yönlendirmesi ile datalar farklı shardlara bölünür ve chunklar şeklinde herbir shard’da farklı datalar bulunur. Mongos Mongos, […]

, ,

Apache Cassandra JDBC Bağlantısı

Apache Cassandra projesi en çok ismini duyuran NoSQL projelerinden birisi. Lakin özgün yapısından dolayı çoğu kişi tarafından (ben dahil) güçlükle anlaşılıyor. MongoDB‘nin kurulum, kullanım kolaylığı ile kıyaslama yapacak olursak böyle düşünmek çok olası. Bundan olsa gerek, Cassandra projesini geliştirenler son birkaç sürüm önce SQL benzeri CQL dilini projeye dahil ettiler. Bu sayede kullanıcılar aşina oldukları […]

,