Big Data (Büyük Veri)
Bu yazımızda özellikle son günlerde sosyal medya platformlarının, verilerin güvenliğini sağlama sorunları ile birlikte sık sık karşımıza çıkan big data kavramının ne olduğunu, tarihçesini ve neden bu kadar popüler hale geldiğini açıklamaya çalışacağız. Bunlara ek olarak dünya genelinde hızla parlayan bu teknolojinin faydalarına ve getirebileceği etik sorunlara değineceğiz. Hazırsanız öncelikle bu teknolojiyi tanımlamakla işe başlayalım.
Big Data Nedir
Türkçe karşılığı ‘büyük veri’ olan big data, farklı insanlardan ve nesnelerden toplanan muazzam boyuttaki verilerin sınıflandırılmış, kullanım alanına göre biçimlendirilmiş ve amaca uygun şekilde kullanılmaya hazır versiyonudur. Big data temel olarak beş farklı bileşenden oluşur. Bunlar velocity (hız), volume (veri boyutu), variety (çeşitlilik), verification (doğruluk) ve value (değer)’dir ve kısaca 5V olarak bilinirler. Kısaca her birini açıklayacak olursak;
Velocity (hız), verilerin olağanüstü üretim hızını bizlere açıklar. Veri analiz şirketi Statista’nın tahminlerine göre 2025 yılında üretilecek toplam veri miktarı 4 yıl sonra dünya üzerindeki tahmini insan sayısına bölündüğünde her insan bir dakikada ortalama 42 megabayt veri üretiyor olacak.
Volume (veri boyutu), bir bakıma big dataya veri eklenme hızının doğal bir sonucudur. Öyle ki, 2018 yılında bir günde üretilen ortalama verinin boyutu (90,4 exabyte) 90.410 insan beyninin depolayabileceği veriye eşdeğerdir. Evet yanlış okumadınız, tam 90.410 insan beyni! Ayrıca 2025 yılına geldiğimizde üretilmesi tahmin edilen yıllık verinin boyutu ise 2018’de üretilenin neredeyse 6 katı (175 zettabyte). Bu rakamlar big datanın kelimenin tam anlamıyla ne kadar büyük bir platform olduğunu gözler önüne seriyor.
Variety (çeşitlilik), verilerin formatlarından, dillerinden ve unicode (evrensel kodlama standartlarına uygun) olmaları bakımından meydana gelen farklılıklarını belirtir. Ne de olsa, her gün toplanan kentilyonlarca bayt verinin tek tip ve bir standarda uygun olması beklenemez değil mi?
Verification (doğruluk), üretilen veriler arasından korunmaya ihtiyaç duyanların güvende olmasını ifade eder. Günümüzde bu gereksinimi karşılamak adına antivirüs yazılımları, veri yedeklemeleri ve blockchain teknolojisi gibi pek çok farklı yola başvuruluyor.
Value (değer), kısaca tüm bu verileri kullanmamızın sebebi ve o verilerle ulaşmak istediğimiz hedeftir. Örneğin bir ticaret şirketi olarak pazarlama ve satış stratejilerimizi geliştirmek adına büyük veriyi kullanıyorsak bu yolla satışlarımızın artması bize büyük verinin kattığı bir değerdir.
Tarihçesi
Big data bu kadar patlamadan önce de insanlar işlerini yürütmek adına verileri kullanıyorlardı tabii ki. Hatta elimizdeki en eski veri kaydı Mezopotamya’da mahsullerin ve sürülerin hesabını yapmak için kullanılmış, tarihi ise MÖ 5000’lere kadar uzanıyor.
Big data evriminin biraz daha günümüze yakın basamaklarına baktığımızda ise, 1887 yılında Herman Hollerith isimli Amerikan istatistikçinin nüfus sayım bilgilerini sınıflandırabilmek için nüfus kağıtları üzerindeki delikleri okuyabilen bir sayma makinesi geliştirdiğini görüyoruz. Bu sektörün bir başka kilometre taşı olarak bundan 46 yıl sonra, ikinci dünya savaşında Nazilerin şifrelerini çözmek adına İngilizler tarafından Colossus isimli bir veri işleme makinesi geliştirildi -evet evet benim aklıma da Enigma filmi geldi, izlemediyseniz şiddetle tavsiye ediyorum-. Devamında, Amerikanlar tarafından 1965 yılında vergi kayıtlarını ve parmak izlerini saklamak adına tarihteki ilk modern veri depolama merkezi kuruldu.
2005 yılına gelindiğinde ise Yahoo! tarafından geliştirilen bir veri depolama ve analiz sistemi olan Hadoop’un kullanıma sunulması ile günümüzde halen içinde bulunduğumuz bu ‘veri patlaması çağı’ başladı. Bu çağın başlarında büyük veri özellikle çeşitli müşterilerin ve kullanıcıların profilini analiz etmek için kullanılıyordu.
2007 yılında Facebook, kullanıcıların internet ortamındaki aktivitelerine göre özelleştirilmiş reklam hizmetini sunmaya başladı. Facebook’tan sonra pek çok sosyal medya platformu bu hizmeti peş peşe kendi bünyelerinde de hayata geçirdiler. Ancak müşteri profillerini belirlemek dışında büyük veri analizinin başka hangi alanlarda kullanılabileceği sorusu halen işlevsel bir yanıt kazanmış değildi; ta ki 2009’a kadar.
2009 yılında başta domuz gribi (H1N1) olmak üzere çeşitli grip salgınlarının baş göstermesi ile birlikte Google, Nature dergisinde yayınlanan bir araştırmada kendi veri tabanından yararlanarak virüsün Amerika’da yayıldığı bölgeleri ve görülme sıklığını analiz etti. Bunun için internette salgınla ilgili bazı anahtar kelimelerin bölgelere göre aranma sıklığı ile vakaların bölgelere göre dağılımı karşılaştırıldı. İkisi arasında ciddi bir bağlantı olduğu tespit edildi. Bu araştırma ile birlikte, büyük verinin çeşitli alanlarda ne kadar kullanışlı olabileceği ortaya çıkarıldı ve kullanım sıklığı önemli ölçüde arttı. Bu evrim sürecini ve her geçen gün farklı bir işlevi keşfedilen büyük verinin potansiyelini düşünürsek şu an bulunduğumuz nokta, bu veri hazinesinin gelişiminin yalnızca başlangıcı demek yerinde olur sanıyorum.
Neden Bu Kadar Önemli
Büyük verinin insanlığa en büyük faydası şüphesiz ki bizleri önceden pek çok alanda kullandığımız varsayımlar veya dar kapsamlı sonuçları genellemekten kurtarması. Örneğin, ticaret sektöründe önceden üretilen ürünlere göre müşteri arama yöntemi benimsenirken büyük veri hayatımıza girdikten sonra firmalar müşterilerin beklentilerine göre ürün üretmeye başladılar. Öncesinde böyle bir şansları yoktu. Çünkü bu kadar büyük kitleleri analiz edecek ve onlar hakkındaki bilgileri sınıflandıracak yetkinlikleri yoktu. Aynı şekilde büyük veri bulunduktan sonra pek çok ülkedeki seçimlerin kampanyaları daha etkili ve daha halka hitap eder hale geldi.
Çünkü otoriteler, bu teknoloji sayesinde seçmen kitlesini analiz edebilme ve isteklerini belirleyebilme yetkinliği kazandılar. Bankalar bu teknolojiyle müşterilerinin bilgilerini analiz ederek onlara özel teklifler, seçenekler ve zengin içerikler sunan kurumlara dönüştü. Yine başka bir önemli konu olan bilimsel araştırmalarda ise araştırmacıların ihtiyaç duydukları genom verilerine kolayca erişebilip depolayabilmesi ve bu verilerin doğru bir düzende işlenebilmesi big data sayesinde mümkün oldu. Büyük verinin sayısız etki alanı arasından sıraladığımız birkaçı bile bizlere bu teknolojinin ne denli hayatımızda yer aldığını gösteriyor.
Peki Hiç mi Tehlikesi Yok
Nasıl ki şu ana kadar hayatımıza giren hiçbir teknolojinin toz pembe olduğunu söyleyemezsek, bunu büyük veri için söylemek de şimdiye kadar tecrübe ettiklerimizle dahi çok zor. Üyesi olduğumuz pek çok site ve kurum kişisel bilgilerimizi ‘servislerini geliştirmek adına’ talep ediyor. Bu bilgilerin mahremiyeti, ne kadarının karşı tarafa aktarılacağı ve üçüncü şahıslarla paylaşılması durumu büyük veriye dair kaygılarımız arasında.
Günümüzde pek çok şirket, kullanıcılarının yahut müşterilerinin bu kaygılarını gidermek adına veri gizliliği konusunda oldukça şeffaf bir politika izlemeye çalışıyor. Fakat endişeler bunlarla sınırlı değil. Bütün bu şüphelerin giderilmesi durumunda bile bizleri bekleyen bazı sorular var. Örneğin tüm bilgilerimize sahip bankaların bize kredi verirken bu bilgilere göre bizleri puanlayıp karar vermesi ne kadar etik? Veya verilerimizin analizine göre sunulan kişiselleştirilmiş reklamlar bizleri tüketime mi özendiriyor? Eğer öyle ise bu durum kabul edilebilir mi? Bu sorular aklımızın bir köşesinde yer ediniyor ve bu teknoloji gelişmeye devam ettikçe aralarına yenileri de eklenecek gibi duruyor.
Son Olarak
Büyük veri, içinde yaşadığımız teknoloji çağının getirdiği sayısız yenilikten yalnızca bir tanesi. Tıpkı diğer yenilikler gibi insanlık adına hem yararlı hem de zararlı olabilme potansiyelini içinde barındırıyor. Şayet bu teknolojiyi sağlıklı bir şekilde yönetebilir ve yönlendirebilirsek dünyanın tüm insanlık için daha güzel bir yer olacağı aşikâr.
YAZAR: Alperen Kars
EDİTÖR: Nazlıcan Güvenoğlu
Son yorumlar