Büyük Veri Konusunda Doğru Bilinen Yanlışlar

27/03/2014 • Haberler, Uncategorized • Görüntülenme: 460

27.03.2014

EMC’nin Global Eğitim Hizmetleri bölümünün Teknik Danışmanı David Dietrich, Büyük Veri konusunda karşılaştığı “doğru bilinen yanlışları” yorumladı.

1. Büyük Veri’yle ilgili en önemli şey boyutudur

David Dietrich, Büyük Veri’nin boyutunu şöyle anlatıyor: “Büyük Veri daha çok verinin boyutu ile ilgilidir çünkü Büyük Veri adı üstünde büyüktür, öyle değil mi? Harvard Üniversitesi Kantitatif Sosyal Bilimler Enstitüsü’nden Gary King’e göre pek de öyle değil… Geçmişe göre daha fazla miktarda veriyle çalışıldığı bir gerçek, ancak insanlar ağırlıklı olarak gigabaytlara, terabaytlara, petabaytlara odaklanırsa, Büyük Veri’ye de veri depolama ve teknoloji ile ilgili bir sorun olarak bakıyorlar demektir.”

Birçok insan verileri rakamlardan oluşan sütun ya da satır olarak düşünür, örneğin bir Excel tablosu, RDBMS ve terabaytlarca yapılandırılmış veri saklayan veri depoları gibi… Bu doğru olsa da, Büyük Veri ağırlıklı olarak yarı-yapısal ya da yapılandırılmamış verilerle ilgilidir. Büyük Veri insanların veriler hakkında düşünürken aklına gelmeyen, RFID yongaları, akıllı cep telefonlarındaki jeo-uzamsal sensörler, resimler, video dosyaları, ses tanıma verileri ve bu verilerle ilgili meta veriler gibi diğer unsurların tümünü içerir.

shutterstock_bigdata

2. “Şirketimin mevcut yapısıyla Büyük Veri’yi analiz edebilirim

İşletmelerin, Büyük Veri’yi işlerken farklı tür veri girdilerini anlayabilen, depolayabilen, analiz edebilen ve bu verileri paralel bir şekilde işleyebilen yeni araçlara ihtiyacı vardır. Bu nedenle sektörde, bu ayrı veri kaynaklarını yönetebilen ve onlarla paralel bir şekilde ilgilenebilen yeni teknolojilere ihtiyaç duyuluyor.

3. Kusurlu veri kalitesi Büyük Veri’nin değersiz olduğu anlamına gelmeli

Büyük Veri kuşkusuz dağınık olabilir ve veri kalitesi de her tür analiz için önemlidir. Ancak, unutulmaması gereken önemli şey verinin doğası gereği “gürültülü” olduğudur. Yani, dikkati dağıtacak birçok şey, farklı birçok anormallik ve tutarsızlık olacaktır. Önemli olan budanabilen ve değerli analizler için kullanılabilen verinin miktarına ve çeşitliliğine odaklanmaktır. Bazı durumlarda, işletmeler büyük veri kaynaklarını ayrıştırmak ve temizlemek isteyecektir, bazılarında ise bu daha az önemli olacaktır.

zamazingo

Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedInPin on PinterestShare on Tumblr

Etiketler: , , ,

Comments are closed.