Bilgiyi Gerçek Bir Şekilde Ölçebilir miyiz?

 

Bazı dilleri konuşan insanların bizlerden daha hızlı konuştuğunu fark etmişsinizdir mutlaka. Mesela İspanyolca yada Çince konuşanlar gibi. Peki bu kadar hızlı konuşmaları bizden daha hızlı iletişim kurmaları anlamına mı geliyor ? Bu tarz diller kulağa oldukça hızlı geliyor çünkü dakika bazında daha fazla heceli konuşulur. Ancak analizlerin gösterdiğine göre bu hecelerin içerdiği bilgi oranı da bir o kadar düşüktür. Yani sonuç olarak dakika bazında aktarılan bilgi neredeyse eşittir.

 

Peki ya yazılı dilde bir kıyaslama yapacak olursak ? Mesela çince karakterlerler ile dolu bir metine baktığımızda bizimki gibi uzun kelimelerin olduğu dillere göre karakterlerin merkezi görme alanımıza daha rahat oturduğunu farkederiz. Bu durumda çince okuyan birisi ingilizce veya türkçe okuyan birisine göre daha mı hızlıdır? Araştırmalara göre ingilizce okuyanlar tek seferde ortalama 8 karakter okurken çince okuyanlarda bu oran 2.6 karakterdir. Çince karakterler yoğun bir yapıda olduğundan hızları birbirlerine neredeyse eşit olmuş oluyor. Yani dakika başına 380 kelime. Buda iletişim hızının dile bağlı olmadığını bizim bilişsel yeteneklerimize bağlı olduğunu gösteriyor.

 

Peki bilgiyi gerçek bir şekilde nasıl ölçebiliriz? Verebileceğimiz en kısa bilgiyi düşünecek olursak bu evet ve hayır yanıtları olurdu. Bunu bilgisayardaki 1 ve 0 bitleri gibi düşünebiliriz.

Bir zarın altı olası çıktısı vardır. Bu yüzden tüm seçenekleri kapsamak için 3 bit bilgi gereklidir. Mesela 1 rakamı için 001, 2 rakamı için 010 ve 3 rakamı için 011 gibi. İngiliz alfabesini baz alırsak 26 harfin her bir harfi beş biti temsil etmektedir. Ancak küçük harfler, noktalamalar, özel sembolleri ve rakamları  eklersek toplamda 95 tane sembol olacaktır. Bu durumda sembolleri kodlamak için 7 bitlik bilgilere ihtiyaç duyarız. Bu konudaki standart 1963 yılında American Standart Code for Information (ASCII) tarafından belirlendi. Kısaca bahsetmek gerekirse ASCII'de 33 tane basılmayan kontrol karakteri ve 95 tane basılan karakter bulunur. Kontrol karakterleri metnin akışını kontrol eden, ekranda çıkmayan karakterlerdir. Basılan karakterler ise ekranda görünen, okuduğumuz metni oluşturan karakterlerdir. Tabi daha sonra yeni karakterlere de yer verilmek zorunda kalınmış (“Ç“, á” gibi) ve genişletilmiş bir ASCII tablosu yapılmış. Yani 8 bitlik bir ASCII tablosu. Daha sonra bilgisayarlarda hesaplamanın temel birimini 8 bit olarak kabul edildi ve ismine de byte denildi.

 

Peki kendimizi dijital olarak oluşturmayı düşünecek olsaydık ne kadar bilgi gerekli olurdu. Tüm genetik kodlarımız 4 molekülün sıralamasından oluşuyor. Adenine(A), thymine(T), guanine(G) ve cytosine(C) olarak DNA’mızda bulunuyor. Bu moleküllerin her biri iki bitlik bir bilgi ile kodlanabilir. Mesela Adenine için 01, Thymine için 00, Guanine için 10 ve Cytosine için 11 gibi. Bunu genomunuzda bulunan 6 milyar genetik kod ile çarparsak ve 8 bit ile bölersek bu yaklaşık 1.5 GB bilgi edecektir. Buda bütün genetik kodumuzu bir CD’nin içerisinde saklayabileceğimiz anlamına gelebilir. Vücudumuzda yaklaşık 40 trilyon hücre bulunmaktadır ve her biri tam olarak DNA kopyasını taşımaktadır. Buda yaklaşık olarak 60 zetabyte (1024 terabyte = 1 petabyte, 1024 petabyte = 1 exabyte. 1024 exabyte= 1 zettabyte) etmektedir. 2020 yılına kadar dünya üzerindeki tüm bilgi bu rakam kadar olacaktır.

Farklı bir perspektiften bakacak olursak dünya üzerinde herhangi bir insanla DNA benzerliğiniz %99.9 oranındadır. Yani sizi siz yapan bilgi bu durumda 1 megabyte’dan az oluyor. Bir floppy disk’in içerisine sığabilecek kadar.

 

Kaynaklar

1) Quora : https://www.quora.com/What-are-the-similarities-and-differences-between-7-bit-and-8-bit-ASCII

2) Veritasium Youtube : https://www.youtube.com/watch?v=zUDqI9PJpc8

3) Wikipedia : https://tr.wikipedia.org/wiki/ASCII