Daha İyi Bir Veri Bilimcisi Olmanız İçin 5 İnanılmaz Yol
Bu yazı datasciencecentral.com adresindeki bir blog yazısının çevirisidir
Çoğu veri bilimcisi, ellerinin mümkün olduğunda çabuk bir şekilde veri ile kirlenmesini isterler ama hemen modellemeye başlamadan önce projenin detaylarına girmek önemlidir. Aklında iş fikri olan bir veri bilimcisi bu işte yoluna çıkacak güç faktörleri, sorunları başarıya ulaşmak için hesaplamalıdır. Farklı aşamalarda çeşitli bilgilere, yöntemlere ihtiyacımız olur ama ilk olarak “understanding the business” cümlesinin ilk aşamasını geçmiş olmak ve başarılı bir veri bilimcisi haline gelebilmek için detaylara hızlı ve derin bir şekilde dalmak gerekiyor.
1 – Bir Kaynak Envanterini Yönetmek
Bir veri bilimcisi olarak, bir veri bilimi projesinin ulaşılabilir kaynaklarının girdi ve çıktılarını bilmek önemlidir. Bu sadece analizini çalıştırmak için ne kadar bilgisayar gücüne ihtiyacının olduğunu anlamak ile ilgili değildir. Profesyonel bir veri bilimcisinin iş uzmanları, veri uzmanları, teknik destek ve diğer veri bilimcileri gibi şeyleri göz önünde bulundurması gerekiyor. Ayrıca sabit ekstreler, canlı veriye erişim, warehouse veri ve kullanıma hazır veri gibi önemli değişkenlerimiz var. Ancak, donanım ve yazılım gibi bilişim kaynaklarının da unutulmaması gerekiyor. Ciddi bir şekilde düşünmeden bir proje alan herhangi bir veri bilimcisi, mayın tarlasına yürüyor demektir ve birşeylerin ne zaman patlayacağını asla bilemez.
2 – Gereksinimleri, Varsayımları ve Kısıtlamaları Anlamak
Çoğu veri bilimcisi iş hedefi olarak ne seçtiyse, tahmin sonuçları noktasında ortalamadan daha yüksek olmak isterler ama başarılı veri bilimcileri bilir ki; doğru tahmin bundan daha fazlasıdır.
Örneğin tüm varsayımları dikkate alan bir veri bilimcisi projede hem iş perspektifini hemde analitik perspektifi anlamış demektir. Bu varsayımlar pek çok formda olabilir -Ancak birisi çirkin yüzünü gösterdiğinde bu genellikle veri ile ilgili olur. Bazen işe bağlı olarak, varsayımlar doğrulanabilir değildir.- ve bunlar en risklileri olabilir. Bu riskli varsayımlara mümkünse listenin en üstünde yer ve öncelik verilmelidir çünkü bunlar keşfetmeyi hedeflediğin sonucun doğrulunu etkileyebilir.
Veri bilimcileri bazı tuzaklar için dikkatli olmalıdır. Verinin biraz yada bütün olarak kaynakların erişilebilirliğini, hatta teknoloji kısıtlamalarını düşünmemiz gerekir. Bu kısıtlamalar geldiğinde olayın dışında düşünmemiz, büyük resmi görebilmemiz gerekir. Örneğin, veri boyutu modelleme için uygun mu? Bu açıkça ortadadır fakat birçok veri bilimcisi bu kritik göz önünde bulundurma kısmını kaçırıyor.
3 – Riskleri ve Olasılıkları Belirlemek
Daha önce hiç sırf dış gecikmeler yüzünden herşeyin parça parça olarak sona erdiği bir projeye başladınız mı? Böylesine şeyler için ön hazırlıkları planlamak akıllıca bir hareket olurdu. Çoğu veri bilimcisi burayı kısa kesiyor ve işleri sağlam temeller üzerine oturtmuyor. Böyle hazırlıklar, ihtiyacınız olduğunda gerçekten işe yarayabilir. Bu gibi durumlarda bir ya da iki yedek plan son derece yardımcı olabilir. Bilinmeyen riskler projenizde, sizi başarı rayından çıkarır. Tecrübe der ki; Her zaman başarısız olmanıza sebep olacak birşey vardır. Yani başlangıçta alternatifleri planlamak gerekir.
4 – Dökümanı Anlamak
‘Ne demek istiyorsun?’ sorusu iş ortamında disiplinler arası bir takımla çalışıyorsanız gerçekten cevap verilmesi gereken önemli bir sorudur. Konu kendi alanımıza gelince ortamdaki diğer insanlarla aynı dili konuşmadığımız açıktır. Herşeyden önce uygun iş terminolojisinin bir çalışma sözlüğünü hazırlamak sizi ve diğerlerini aynı rotada tutacaktır. Bir diğer iyi uygulama ise tanımlamalar ve resimlendirilmiş örnekler ile bir veri bilimi terminolojisi oluşturmaktır, ama bu direkt olarak elinizdeki işin problemleri ile ilgili olmalıdır. Tabiki bunun 700 sayfalık bir döküman olması gerekmez, en doğrusu tüm taraflar için ikna edici ve yararlı şeyler kullanmaktır. Unutmayın diğerlerinin bir veri bilimcisi olarak senden istediği; sadece en üst seviyede çalışanlar diğerlerinin derinlemesine istatistik ve kod bilmesini ister.
5 – Maliyet ve Faydayı Hesaplamak
Bu kısım veri bilimi projenizdeki değeri gösterebilmek için iyi bir yöntemdir. Hatırlayın, işi destekleyen bir profesyonel olarak ‘Bu veri bilimi projesini değerli kılan şey midir?’ sorusunu sormak ve cevaplamak önemlidir. Projenin birleşmiş maliyetlerin potansiyel faydalara karşı basit bir karşılaştırması ve bunun başarılı bir şekilde yapılması sizin ve işiniz için büyük bir yol katedecek olamanız demektir. Daha projenin başında bunu bilmek size ve organizasyona iş bitiminde açıkça fayda sağlayacaktır. Bana göre bu soruları sormamak ve cevap vermemek, başarılı bir Veri Bilimcisi olma yolunda kariyerinizi limitleyen bir harekettir. Bu işi kendiniz üstlenmek için sağduyuyu kullanın ve işinizde meslektaşlarınızın veya yöneticilerin bunu yapmanızı istemesini beklemeyin.
Özet
Veri bilimi iş bağlamında olgunlaştıkça bir Veri Bilimcisi durum değerlendirmesinde, bir envanter almakta, risk ve riskin gelişme ihtimalini öğrenmekte ve başarılı bir veri bilimi projesine sahip olmanın maliyet avantajlarını anlamakta daha uyanık olmalı ve farkındalığını arttırmalıdır. Her veri bilimcisi bu adımları uygulamaz, ama tekrar, her veri bilimcisi son derece başarılı değildir. İş’te sağlam bir veri bilimi metodolojisi çöldeki bir damla su gibidir. Size en çok ihtiyacı olduğu zamanda susamış organizasyonunuzu bırakmayın.
R ile Korelasyon, Regresyon ve Zaman Serisi Analizleri Veri analizinde yeni alışkanlıklar
Merhaba.
Bu tur yazilarda anlamadigim nokta, is gelistirme ve proje yoneticisi pozisyonlari ile veri bilimcisini birebir ayni isleri yapar, ayni problemleri cozer gosteriyorlar. Veri madencisinin modellemesi icin bir iki cumle de eklendimi o kisimda hallolmus oluyor sanki. Veri bilimi kismi nerede peki ?