Herkese merhaba,
Geçen haftadan itibaren Bayes teoremi
ile uğraştığımızı fark etmişsinizdir. Bu istatistik yöntemini
kullanarak sosyal medyada karşılaşabileceğiniz cinsten bir test
oluşturmaya çalışıyoruz. Bu testimizde ortak blog yazılarımızla
oluşturduğumuz verilerden yola çıkarak, yeni bir yazı
girdiğinizde bunun ekibimizden hangisinin yazısına benzediğini
bulmaya çalışıyoruz. Bugün de yine bu testimizi oluşturacak kod
üzerinde çalıştık. Starbucks'a gidip yine en büyük masayı
kaptık ve büyük oranda bitmiş olan kodumuzdaki fonksiyonların,
parametrelerin adını ilk kez bakan bir kişinin de kolayca
anlayabileceği şekilde değiştirmeye başladık. Açıkçası kodu
yazmak kadar zor oldu bu aşama. Çünkü bir parametreyle kodun
farklı yerlerinde tekrar tekrar karşılaşabiliyorsunuz ve ismini
değiştirdiğiniz parametreleri bir süre sonra takip etmek
zorlaşıyor. Bu aşamayı da atlattıktan sonra geriye testimizi bir
web sayfasında işler hale getirmek kaldı. Onu da yaptık mı bu
ödevimizi tamamlamış olacağız.
Bayes tüm vaktimizi alıyor gibi
görünse de bugün yine çok yararlı iki Skype görüşmesi yaptık.
Bunların ilkinde Yrd. Doç. Dr. Ömer Sinan Saraç ile görüştük.
4 sene ODTÜ'de doktora yaptıktan sonra Dresden Teknik
Üniversitesi'nin Biyoteknoloji Merkezi'nde araştırma görevlisi
olarak çalışan Ömer Sinan Saraç şimdi İTÜ Bilgisayar ve
Bilişim Fakültesi'nde öğretim görevlisi olarak çalışmakta.
Konuşmamızın odak noktası biyoinformatik çalışmak için
nelerin bilinmesi gerektiğiydi. Bunun için Ömer Hoca bizim de daha
önceden öğrenmiş olduğumuz “Makine Öğrenimi”(Machine
Learning)* kavramı üzerinde durdu. Makine öğrenimi metodlarının
herkesçe bilinebileceğini ancak nasıl kullanılması gerektiğini
bilmenin kritik bir nokta olduğunu anlattı. Bir biyoinformatikçinin
kesinlikle bilmesi gereken bir diğer şey ise istatistik. İstatistiği çok iyi bilmemiz gerektiği için internet üzerinden veya "Youtube" gibi video sitelerinden dersleri takip etmemiz için tavsiyelerde bulundu. Ayrıca son
günlerde Bayes istatistiğiyle uğraştığımızdan Ömer Hoca biz
bu konuda bazı bilmecemsi sorular yöneltti. Son sorduğu soruyu
sizlerle de paylaşmak istiyorum.
Bir odada 20 mahkumumuz var ve her
birinin bir numarası var. Başka bir odada ise 20 kutu var ve yine
her birinin içinde mahkumlara verilen numaralardan bulunuyor.
Mahkumlar ayrı ayrı bu odaya girip kutuları açtırarak kendi
numaralarını bulmaya çalışacaklar ve bunun için her birinin
sadece 10 hakkı var. Numaralarını bulurlarsa güvenli bir şekilde
diğer mahkumlarla karşılaşmadan başka bir odaya alınıyorlar.
Ancak bir kişi bile 10 hak sonunda kendi numarasını bulamazsa
bütün mahkumlar idam edilecek. Sorumuz şu: mahkumlar nasıl bir
strateji izleyerek kurtulma şanslarını artırabilirler ve kurtulma
şansları en fazla ne kadar olabilir? Henüz bir sonuca varamadık
ama çözebiliriz diye umuyorum. :)
İkinci Skype konuğumuz ise Selin
Arslanhan Memiş'ti. 2008'de İstanbul Üniversitesi Moleküler
Biyoloji ve Genetik bölümünden mezun olduktan sonra 2010 'da TOBB
Ekonomi ve Teknoloji Üniversitesi İş İdaresi Programı (MBA)’nda
yüksek lisansını bitirdi. Şu an TEPAV (Türkiye Ekonomi
Politikaları Araştırma Vakfı)'nda sağlık politikaları ve yaşam
bilimleri ile ilgili çalışmalar yapıyor. Moleküler Biyoloji ve
Genetik bölümünden mezun olunca ilerleyebileceğiniz farklı bir
yol olabileceğini gösteren güzel bir örnek olduğunu
söyleyebilirim. TEPAV'da çalışmaya nasıl başladığını ve
burada ne tür projeler yürüttüğü hakkında konuştuk ve bir MBG
mezununun farklı alanlardan gelmiş insanlarla anlaşma sürecinin
nasıl ilerlerdiğini dinledik.
Stajımı bu hafta bitireceğim için
artık ortak bloga katkıda bulunamayacağım ama uzaktan takip etmeye
devam edeceğim. Lütfen siz de bu güzel ekibin çalışmalarını
takip etmeye devam edin :).
Sevgiler,
Evrim Fer
*Makine Öğrenimi hakkında daha fazla bilgiye
“22 Temmuz” başlıklı blog yazılarımızdan ulaşabilirsiniz.
Hiç yorum yok:
Yorum Gönder