Cyfrowy potop

Cyfrowy potop

Dwanaście miliardów gigabajtów informacji wytworzyli ludzie od epoki kamienia łupanego do 1999 r. Na podwojenie tej liczby wystarczyły zaledwie trzy następne lata!
W ciągu roku internauci generują tysiąc razy więcej informacji niż ukazuje się drukiem

Pojawiającymi się codziennie nowymi danymi można by zapełnić dyski twarde w przeszło stu tysiącach domowych komputerów. Jedynie ułamek procentu informacji ukazuje się drukiem (książki, gazety, dokumenty biurowe). Większość publikowana jest w Internecie - dowodzą naukowcy z uniwersytetu w Berkeley w Kalifornii. Ten zalew informacji porównywany jest do biblijnego potopu.

Ukryta sieć
Cyfrowy licznik odmierzający przyrost liczby publikowanych w sieci informacji pracuje na witrynie firmy EMC. Co pięć sekund przybywa jeden terabajt danych (1 TB to tysiąc gigabajtów), a więc tyle, ile zawiera księgozbiór sporej biblioteki uniwersyteckiej. Nie wszystkie dane są jednak utrwalane, gdyż nie starczyłoby na nie miejsca. "Człowiek nigdy wcześniej nie miał dostępu do tylu wiadomości z całego świata. Ale też nigdy wcześniej samodzielnie nie generował i nie rozpowszechniał tylu informacji" - konstatuje Peter Lyman z Berkeley.
Polscy internauci, których jest około 5 mln, założyli już kilkanaście milionów prywatnych witryn. Eksperci firmy BrightPlanet wyliczyli, że w połowie 2000 r. wszystkie witryny na świecie zajmowały około 19 TB. Znacznie więcej danych zawiera według nich "ukryta sieć", czyli podpięte do Internetu bazy danych. Nie są one indeksowane przez wyszukiwarki, ale dostęp do nich można uzyskać z witryn firm, które je prowadzą. Same zbiory internetowe NASA oceniane są na 300 TB. Łącznie objętość globalnej sieci w 2000 r. pracownicy BrightPlanet oszacowali na przeszło 7500 TB.
Na początku 2001 r. istniały 4 mld ogólnie dostępnych stron internetowych - wynika z analiz prowadzonych przez firmę Cyveillance. Codziennie przybywa ponad 7 mln nowych. Zasoby Internetu rosną więc w tempie niemal 100 proc. rocznie. To jednak listy elektroniczne - a nie strony WWW - zajmują w sieci najwięcej miejsca. W ubiegłym roku na całym świecie przesłano ponad bilion e-maili o łącznej objętości około 20 tys. TB. Wypada po 650 stron korespondencji na mieszkańca ziemi rocznie! A należałoby dodać do tego jeszcze wiadomości z list dyskusyjnych i komunikatorów internetowych.

Braki pamięci
Dane przechowuje się na papierze, filmie, dyskach optycznych (CD i DVD), nośnikach magnetycznych (taśmy i dyski) i krzemowych (pamięć flash). By zapisać wszystkie publikowane każdego roku książki, gazety i inne periodyki oraz różnorodne papierowe dokumenty, potrzeba niespełna 25 TB pamięci. Dla porównania - na zapisanie wszystkich multimedialnych dokumentów tworzonych w tym samym czasie przez użytkowników komputerów trzeba co najmniej 30 000 TB. - Aparat cyfrowy czy odtwarzacz mp3 mają dużo więcej pamięci niż pierwsze pecety. Pojemność pamięci w komputerach niemal podwaja się co roku. Wzrost ten w najbliższych latach może być jeszcze większy, gdyż dopiero upowszechnia się przygotowywanie na domowych komputerach bardzo "pamięciożernych" materiałów: cyfrowych zdjęć, plików muzycznych czy własnych filmów nagranych kamerą internetową. Sprzyja temu systematyczny spadek cen pamięci: układ o pojemności 512 MB kosztuje obecnie tyle samo, co kilka lat temu układ 4 MB - ocenia Paweł Śmigielski, dyrektor ds. rozwoju Kingston Technology Europe.
W ciągu 20 lat wielkość standardowo instalowanego w komputerze domowym twardego dysku wzrosła 10 tys. razy! To i tak zbyt mało, by zapisywać wszystkie interesujące materiały. Każdy użytkownik peceta wie z praktyki, że na dysku trzeba regularnie robić porządki, by było miejsce na nowe dane. Pamięci brakuje także dużym firmom. Dlatego operator telekomunikacyjny Energis zbudował w Piasecznie (woj. mazowieckie) gigantyczny magazyn danych (5000 m2 powierzchni). - Nasze centrum internetowe może pomieścić ponad 1000 TB informacji. To największy taki ośrodek w Polsce i jeden z największych w Europie. Przygotowani jesteśmy do zainstalowania czterystu regałów z serwerami i macierzami dyskowymi. Każda z takich szaf mogłaby pomieścić księgozbiór Biblioteki Narodowej - twierdzi Jarosław Mikos, prezes zarządu Energis Polska. Utrwalenie danych to dopiero połowa sukcesu, pozostają one bowiem bezwartościowe bez możliwości szybkiego przeszukiwania.

e-Arka
Jak nie utonąć w potopie informacji? Ratunek mają przynieść wyszukiwarki, filtry wiadomości i personalizacja zasobów. Każdy program pocztowy umożliwia zdefiniowanie reguł obsługi listów elektronicznych. Dzięki temu wiadomości od danej osoby czy firmy będą od razu trafiać do przeznaczonego dla niej katalogu. Automatycznie mogą być kasowane e-maile od niepożądanych nadawców. Utworzenie precyzyjnej listy reguł jest bardzo proste. Dzięki temu oszczędza się wiele czasu i nerwów. Z kolei, by ułatwić sobie korzystanie z dużych serwisów informacyjnych, warto poświęcić chwilę na ustawienie sposobu pobierania z nich wiadomości, czyli tzw. personalizację serwisu. Przypomina to planowanie układu materiałów we własnej gazecie. Na przykład możemy sprawić, że jako pierwsze będziemy otrzymywać informacje sportowe, gospodarcze albo prognozę pogody, a dopiero w drugiej kolejności te wiadomości, które są dla nas mniej istotne.
W sieci działa kilkadziesiąt mechanizmów lokalizujących pożądane materiały (tekst, zdjęcia lub pliki). Do przeglądania polskich zasobów Internetu warto wykorzystywać wyszukiwarki z krajowych portali, gdyż uwzględniają pisownię i odmianę polskich słów. Pomocne jest też korzystanie z filtra rodzinnego, który pomija strony erotyczne i pornograficzne (wiele z nich imituje witryny o innej tematyce, co ma zwiększyć ich oglądalność). Jednak nawet najlepsze wyszukiwarki zawodzą. Ma się to zmienić po wprowadzeniu Internetu semantycznego, w którym definiowane będzie znaczenie poszczególnych informacji - prace nad tymi rozwiązaniami są już na ukończeniu.

Okładka tygodnika WPROST: 25/2002
Więcej możesz przeczytać w 25/2002 wydaniu tygodnika „Wprost”
Zamów w prenumeracie lub w wersji elektronicznej:
 0