kişisel internet günlüğü
Gördüğüm iyi öğretmenler, sınıfına sade düşündürebilen, “bu muymuş yani?” dedirten insanlardı hep. Bazılarını daha yakından tanıyınca kendilerinin de sade ve net düşündüğünü farkettim. Tuğlaları birer birer koyarak koca binalar inşa ediyorlar.
Tanıdığım iyi öğretmenlerin, kitaplardan öğrendiğim dehaların ve zeki arkadaşlarımın (öss derecesi ile sınıflandırmıyorum!) karmaşıklığa girmeden sorunları çözdüğünü ve yollarında ilerlediklerini gözlemliyorum. Sade ve bilimsel bir metoddan kastım şöyle:
Önkoşul 1: Net bir problem tanımı
Problem tanımı belli olacak. Öyle zırt pırt da değişmeyecek.
Önkoşul 2: Veri toplama
Bilimsel metodda önce hipotez vardır. Ama ona geçmeden önce probleme dair verilerin elimizde olması lazım. Örneğin, deri sezimi yapacaksak elimizde ten renkleri bilgileri ve onların doğrulukları olmalı. Ya da plaka tanıyacaksak elimizde plaka resimleri olmalı. Bu adımdan bahsetmek çok saçma, çünkü herşey açık ama bu şekilde ilerlemeyen çok çalışma gördüm. Böyle kimseler doğrudan hipotez ile başlıyor, bahsedeceğim gözlem maddesini de zırvalıyor ve gerçeklikten uzak tartışıp duruyorsunuz; bir yere de varamıyorsunuz.
Veri toplama bazen çok bunaltıcı olabiliyor. Bir ay boyunca yüz verisi toplayan arkadaşlarım var! Ben de bir buçuk yıldır kaşların, gözlerin, vb. çeperlerinde nokta tıklıyorum! Tezimin yarısı nokta tıklamakla geçiyor. Sulu/susuz şakalar yaparak, kahve-cigara molalarında tartışarak, meyve destekli yardımlarda bulunarak, gece laboratuvarda perişan olmasın diye evine bırakarak, bazen de beraber hayata küfrederek birbirimize moral olmaya çalışıyoruz. Yaşamaya devam ediyoruz…
Buradan sonra hipotez, gözlemler ve sonra teorem vardır ama konumuz bunun sadelik içinde olması, o yüzden adımlar biraz daha ayrıntılı bence.
Başlangıç
Çözüm için ilk adım akla gelen ilk yaklaşımları uygulamak! Böyle bir başlangıç çok önemli çünkü nedense basitliği (simplicity) küçük görürüz. Denemeye gerek duymayız. Etrafımızdaki ne dediğini anlamadığımız, karmaşık cümleler kuran, bilmediğimiz terimler kullanan, lafları geveleyip konuşan insanları bir şey sanarız. Basit yaklaşımlara da “Bu ne ya, ben de yapardım!” der, kenara atarız.
Bu adımda insan problemi de daha derinden kavrayabiliyor, bu da ilerisi için çok büyük bir artı.
Gözlem
Denenen yaklaşımların sonuçlarına bakmak lazım. Bu da oturup kodunu yazmak, verilere uygulamak ve sonuçları beklemek olabiliyor. Eğer benim gibi videolar ile uğraşıyorsanız bu kısımda işiniz zor. Örneğin elinizde 200 video var ve her video 3 saniye. Pek fazla değil gibi, değil mi? Bulanık olmasın diye her saniye 30 kare demek ve her kare 640×480 ebatlarında. Elinizde 18000 tane 640×480′lik resim var gibi birşey. Bir kaç gün beklemek gerekebiliyor. Küçük bir hata olmuş kodda ve sil baştan…
Başlangıç ve gözlem aşamaları muhtemelen bir döngü içinde bir kaç sefer tekrarlanacak …
Sonuç
Ve son olarak, eğer sadelik yeterli olmazsa daha karmaşık bir modele geçilmeli. En başarılı/verimli irdelemesiyle de bitmeli.
Odaklanmak, düşünmek, üşenmemek, denemek.
Eğer bir de “bilgisayarla görme” gibi çoğu verimli/başarılı yaklaşımın çok basit çözümler olduğu bir alanda çalıştığımızı düşünürsek, üstteki dört fiil daha da anlam kazanıyor.
Öğrenme dünyasının özlü sözüyle bitirelim: Herşeyin en güzeli en sadesi!
bluekid
23 Haziran 2008, 12:01 pm
2. Önkoşul Veri toplama gerçekten çok sıkıcı ve sıkıntılı ama bunda üniversitelerimizin suçu yok mu ?
Yabancı üniversitelerin hazırladığı pek çok veri tabanına ulaşılabiliniyor. Benzerlerini Türkiyde göremedim. iki ihtimal var
1. Veritabanının pek de önemli olmadığını düşünüp Yabancıların hazırladıklarıyla yetiniliyor.
2. Aslında Proje bazında kısıtlıda olsa hazırlanıyor fakat genel kullanıma açılmıyor
Bütün bu sıkıntıları kendiniz hazırlayarak istesenizde aşamayabilirsiniz. Çünkü Yapabilecekleriniz olduğu gibi uzmanlık gerektiren durumlarda olabilir.
Atıyorum Mesela Beyin tomografilerinden Kist tespit edecek bir proje geliştirmek istiyorsunuz. Tomografileri bulması bir dert anlayıp sınıflandırılması ayrı dert…
Bitirme projesi olarak verilen Litaratür tarama ödevleri yerine bu tip veri tabanları hazırlattırılsa çok daha faydalı olmazmı ?
ismailari
23 Haziran 2008, 12:51 pm
Çok haklısınız. Aslında sorun (2. maddede dediğiniz gibi) bizim veritabanlarımızın olmaması değil de bunların duyurularını yapmamış olmamız. En azından benim birlikte çalıştığım grup için böyle. Bazen bunların açılmaması da tercih edilebiliyor. Çünkü bazen algoritma geliştirme kısmı dediğim gibi basit oluyor ve veritabanı olunca sonuca çabuk varılıyor. Veritabanı olan bir-sıfır önde başlıyor işlere. Yerli-yabancı okuduğum bazı makalelerde insanların veritabanlarını sadece makale değerlendiricilerine veya çok küçük bir zümreye açtıklarını görüyorum. Duyduğum kadarıyla da yabancılar toplar toplamaz açmıyorlar verilerini. Önce biraz emeklerini değerlendiriyorlar, çalışmalarını deniyorlar. Herkesin yapabileceği basit işleri bitirince ve ilerlediklerinde açıyorlar. Aslında kullandığımız veritabanlarının çoğu ile işlerini bitirmiş oluyorlar. Veya da makale çıkarıp öyle açıyorlar ve kullananlar atıfta bulunuyor.
İğneyi biraz da kendime batıracak olursam; geçen yıl hazırladığımız veritabanını kullanıyorum ama formatını düzenlemeye üşendim. İnternete açmadım. Makale çıkınca çoğu insan da peşini bırakıyor zaten. Tezi bitirip zaman bulunca laboratuvar sayfasına koyacağım veritabanını.
Bazı projelerde ise dediğiniz gibi profesyonel bir ekip ve techizat olmadan adım atmak mümkün değil. Biyomedikalciler veri toplamak için sıklıkla hastahanelere giderler örneğin.
Bitirme projesi kısmına kısmen katılabiliyorum. Çünkü ben bitirme projemin tümünde böyle bir iş yapmak istemezdim :) Ama katkı sağlamak isterdim. Çünkü zaten benim işime yarayacak. Bu iş için laboratuvarları merak eden, dahil olmak isteyen daha küçük lisans öğrencileri daha uygun sanki. Ama orada da şöyle büyük bir problem var. Örneğin ben istatistiksel çalışıyorum ve toplanan noktaların konumları çok önemli. Çoğu zaman veri toplarken aklıma bir fikir geliyor, verilerde değişiklik yapıyorum. Ve de veri toplamanın niteğili çok önemli. Örneğin toplama işi kolay olsun diye ardarda gelen karelerde kopyala-yapıştır yapılabilsin, sonra küçük değişiklikler düzeltilebilsin amacıyla bir arayüz yazmıştım. Ama işin sıkıcılığından insanlar genelde kolaya kaçıp sıfırdan işaretlemek yerine bu özelliği kullandılar ve topladığımız veri benim model geliştirmemde pek işe yaramıyor. Bu çok normal bir durum çünkü yeni bir şeyler öğrenemeyince hepimiz sıkılıyoruz…
Veri toplamanın içindekiler daha sonra onu kullanacak kişiler olursa daha bir iyi oluyor. Tüm verileri tekrar işaretleyen sadece ben de değilim, çok yakın tanıdıklarım var :)
Aslında şöyle bir şey yapmak iyi olabilir. Bir site aracılığıyla böyle bilgileri paylaşmak. Verileri değil de, nerde olduklarını ve nasıl kullanılacaklarını. Böylelikle yabancı veriler de kullanılmış olunur. O işle ilgilenecek insanlar önce oraya başvururlar. Böyle bir yerli site/forum var mı acaba, bilemiyorum.
Biraz daha kendimize dönecek olursak, öyle durumlar gördüm ki:
- İnsanlar 15-20 tane resimde ten rengini işaretleyip çalışmaya başlamaya üşeniyorlar. Elimde veritabanı yok deyip ayak sürüyorlar. İnterette insan resmi dolu, dolayısıyla da ten rengi.
- Biriyle konuşuyoruz. Elinde o veritabanı var veya nasıl ulaşılacağını biliyor. Sadece veritabanı için de değil. Örneğin problemin çözümünü biliyor. Ama neden size söylemiyor, orasına aklım ermiyor.
Bir de hala klasik yöntemler çok baskın. Yani yüzyüze konuşursanız paylaşıma geçebiliyorsunuz ama internet ile olamıyor! Çoğu araştırmacının kişisel sayfası yok, bazıları tezini bile kişisel sayfasına koymuyor. İlginç, bir o kadar da düşündürücü :)
İlk sorunuzu ben de düşünüyorum. Bizim üniversitelerimizin çoğu internet çağını henüz yakalayamadılar. Dünyalaşamadılar da diyebiliriz sanırım. Öğrencileri birbirlerinden bihaberler, paylaşım pek yok (Parayla proje yaptırtan tembel öğrencileri saymazsak!). Örneğin yüksek lisans veya doktora öğrencilerinin bir dönem de gidip Sabancı’da, Koç’ta, ODTÜ’de çalışma yaptığını hiç görmedim, duymadım. Hocaların ilişkileri var ama bahsettiğim kısım olmayınca (işler tabana yayılmayınca) pek etkili olamıyor. Umarım bir gün daha iyi olacak :)
Son olarak; veri toplamak hakkaten zor iş. Basit bir iş de değil, küçük hatalar tüm veriyi (dolayısıyla zamanı) çöpe atabilir.
Napoleon araştırmacı olsaydı “Para, para, para” yerine “Veri, veri, veri” derdi sanırım!
bluekid
23 Haziran 2008, 1:25 pm
Sadece bu tip işlerle ilgili projeler geliştirenler açısında düşünürseniz. Adam projesi için bir sürü eziyet çekip bir veri tabanı oluşturmuş hemen ortalığa yayınlaması hakikaten zor.
Fakat üzerinden yıllar geçmiş projeler de yok mu ?
İkinci olarak Kast ettiğim işlenmiş veriler değil ham verilere bile ulaşılamıyor. mesela ben “KGDD lerde Nodul sayısı tespiti” için gereken verileri bulmak için internette beyhude dolandım durdum. Oysa bu ham veriler ilgili konuda insan eğitimi içinde bir zorunluluk aslında.