Każdego dnia użytkownik internetu zostawia cyfrowe ślady. Nie chodzi wyłącznie o korzystanie z urządzeń mobilnych czy komputerów, ale i karty płatnicze czy zegarki, a nawet podłączone do sieci samochody. Nasz ślad cyfrowy to także wiadomości, które zaczęliśmy pisać na Facebooku czy Gmailu, ale których np. nie zdecydowaliśmy się wysłać. Korporacje rozumieją bowiem, że taka treść może być znacznie ciekawsza niż ta wysłana czy opublikowana. Warto zastanowić się, jak możemy ograniczać ilość danych, którą zostawiamy na swój temat.
Już w 2012 roku wykazano, że każdy użytkownik zostawia około 500 MB danych dziennie. Gdyby chcieć to zapisać na papierze dla wszystkich internautów, to już wtedy zajęłyby one stos kartek A4 o odległości równej czterokrotnej drodze z Ziemi do Słońca, i to tam i z powrotem. Przez ostatnie 8 lat zostawiamy ich nawet jeszcze więcej. Szacuje się, że do 2025 r. będzie ich około 62 GB. Jakbyśmy chcieli zapisać to na płytach DVD, ich stos zająłby 105 tys. kilometrów. Tylko na platformie YouTube każdej minuty wysyłane jest 300 godzin materiału filmowego. Dla szerszego zestawienia, warto jest zapoznać się z tym, co dzieje się każdej minuty w internecie. Ilustruje to poniższa grafika.
Źródło: https://2oqz471sa19h3vbwa53m33yj-wpengine.netdna-ssl.com/wp-content/uploads/2019/03/internet-minute-820.jpg
Obecnie dochodzi już do sytuacji, w której dane wożone są ciężarówkami. Amazon posiada specjalną ciężarówkę nazywaną Snowball, która na swojej przyczepie ma zamontowany dysk o pojemności 100 Petabajtów (1 PB = 1000 TB). Zapełnienie dysku zajmuje 10 dni. Służy ona migracji danych wielkich korporacji do usług chmurowych. Ciężarówka podpinana jest do serwerów usługobiorcy, a następnie dane przewożone są do serwerów dostawcy usług chmurowych. Takie przeniesie danych jest szybsze i bezpieczniejsze, ponieważ wysłanie poprzez internet zajmie bardzo dużo czasu, a przy tym jeszcze łatwiej o nieautoryzowany dostęp. Dane są bardzo wartościowe, a ich ceny zbliżają się do wartości oleju napędowego. Jest tak dlatego, że tak duże ilości danych, które produkujemy w tym momencie, są paliwem dla algorytmów sztucznej inteligencji. W tym samym czasie nasze możliwości produkowania danych rosną dużo szybciej niż możliwość przesyłania ich.
Duże firmy takie jak Visa czy MasterCard powoli zmieniają swoją działalność finansową na taką, która oferuje wiedzę na temat konsumentów. Bardzo chętnie płacą, aby klienci nosili ich kartę kredytową. Dzięki temu mogą zbierać informacje, następnie sprzedać takie dane np. Facebookowi, aby ten z kolei mógł je połączyć z działalnością użytkowników w mediach społecznościowych i targetować ich odpowiednimi reklamami. Tesla, definiuje się nie jako producent samochodów tylko producent danych. Największą wartością są informacje zbierane podczas jazdy, a to dlatego, aby ulepszać algorytm, który umożliwi w przyszłości całkowicie autonomiczną jazdę.
Algorytmy, które zasilane są informacjami o obywatelach, wykorzystywane są też w medycynie. Już teraz algorytm dużo lepiej oceni np. stan pieprzyka, czy jest on zagrożeniem i może przerodzić się w raka skóry niż dermatolog z 20 letnim doświadczeniem. Jest to również niewątpliwie minus, że sztuczna inteligencja może kiedyś zabrać pracę danym grupom zawodowym. Nie ulega jednak wątpliwości, że będzie ona jednocześnie wspierać nas w naszej codziennej pracy, a nie tylko zwiększać zyski wielkich korporacji czy pojedynczych jednostek. Z drugiej strony, takie rozwiązania mogą być bardzo pomocne dla ludzi, którzy nie mają dostępu do opieki medycznej, bądź po prostu ich na to nie stać.
Kolejną interesującą kwestią jest też precyzyjne prognozowanie przyszłych trendów czy wydarzeń. W 2008 r. Google przewidział epidemię grypy. Wszystko przez to, że jest to mocno rozproszona przeglądarka i korzysta z niej większość internautów na świecie. W okresie jesiennym było więcej zapytań typu „katar”, „gorączka” niż w poprzednich latach, co przy tak dużej liczbie internautów mogło dać oczywiste wnioski.
Warto w tym kontekście pamiętać, że jeżeli dane usługi, portale, filmy czy aplikacje są bezpłatne, to niejako produktem staje się sam użytkownik, który z nich korzysta. Nie ma nic za darmo. Dominujący model generowania zysku w oparciu o eksploatację danych jest bardzo rozpowszechniony. Aby marketing był jak najbardziej trafny, należy na początku zebrać informacje o osobach odwiedzających daną stronę czyli mówiąc wprost, trzeba stworzyć profile czytelników. Dobierając ich w grupy wiekowe, płeć, zainteresowania, częstotliwość wizyt i rodzaj odwiedzanych serwisów. Duże firmy zbierają o nas informację do celów marketingowych, a przestępcy by okradać nas samych bądź nasze rodziny czy znajomych.
Bądź ostrożny w podawaniu danych wrażliwych
Daty urodzenia, pesele, numery telefonów, adresy zamieszkania traktuj jako świętość. Wiele z tych głównych informacji wykorzystywanych jest do weryfikacji tożsamości w instytucjach finansowych, urzędach i innych ważnych podmiotach. Nie ułatwiajmy niepowołanym osobom dostępu do swoich finansów albo nawet akt chorobowych u lekarza. Bądźmy ostrożni podczas podawania takich informacji i dogłębnie analizujmy, czy aby na pewno są one potrzebne do danych czynności i jak mogą zostać wykorzystane.
Konrad Mazurek