W kontekście cyfrowej gospodarki często mówi się o danych jako nowym paliwie napędzającym gospodarkę. To porównanie ma swoje źródło w tytule raportu “The Economist” z maja 2017 roku zatytułowanego “The world’s most valuable resource is no longer oil, but data”. Skrótowo używa się także powiedzenia “data is a new oil“.
To porównanie jest niezwykle obrazowe, jednak nie do końca oddaje rzeczywistość. Jest sporo różnic pomiędzy tym, jak ropa naftowa i dane wpływają na gospodarkę.
Czy dane to nowe paliwo dla gospodarki?
W przypadku ropy naftowej jednym z podstawowych czynników jest lokalizacja jej zasobów oraz ich skończoność. Największy wpływ na gospodarkę mają ci, którzy kontrolują złoża ropy i możliwość jej wydobywania.
W przypadku danych nie ma mowy o ryzyku wyczerpania zasobów – danych mamy wręcz coraz więcej. Jednak dane stają się nowym paliwem dla gospodarki dopiero, gdy są przetworzone w taki sposób, że można je wykorzystać.
Afera Cambridge Analityca pokazała jasno skalę wpływu na naszą rzeczywistość działań opartych na przetworzonych danych (pomijam tu kwestię legalności działań tej firmy). Samo posiadanie danych to za mało – dopiero ich analiza, oczyszczenie z tzw. szumu oraz odpowiednie zestawienie pozwala na ich efektywne wykorzystanie – często z niezwykłą skutecznością.
Oznacza to, że punkt ciężkości przesunął się z właścicieli danych na tych, którzy potrafią je przetwarzać. Rzadko są to te same osoby.
Dane nieosobowe
Dotyczy to zwłaszcza danych nieosobowych wytwarzanych w przemyśle (polecam lekturę O co chodzi ze swobodnym przepływem danych nieosobowych?).
Dane takie gromadzone są zazwyczaj w izolowanych, autonomicznych bazach danych – każda firma ma swoje dane. I prawie każda próbuje zbudować na nich swój przyszły model biznesowy.
Jednak specyfiką danych jest to, że aby je skutecznie wykorzystywać, potrzeba ich coraz więcej i więcej. Zwłaszcza, jeśli dane mają być wykorzystane w ramach rozwiązań opartych na tzw. sztucznej inteligencji. Rozwiązania te są tak wymagające w zakresie ilości potrzebnych danych, że nie jest już wystarczające wcześniejsze rozpoczęcie procesów digitalizacji i zgromadzenie w swoich zasobach więcej danych niż konkurencja. Nadal tych danych jest za mało, by uzyskać sensowną przewagę konkurencyjną.
I tu pojawia się nowy model biznesowy – dzielenia się danymi przez firmy.
Dzielenie się danymi?
Nie jest to oczywiste rozwiązanie, gdyż żadna firma nie chce dzielić się swoimi danymi – a tym samym tajemnicami handlowymi – z innymi, ponieważ obawia się utraty w ten sposób swojej przewagi konkurencyjnej.
Jednak pojawia się coraz więcej przykładów, gdy konkurenci przełamują swoje obawy. Jedną z takich dziedzin jest przemysł farmaceutyczny. Opracowywanie nowych leków jest niezwykle kosztowne, gdyż wymaga wielu eksperymentów.
Wykorzystanie mechanizmów uczenia maszynowego do analizy uzyskiwanych danych pozwoliło na obniżenie kosztów i skrócenie czasu badań, jednak algorytmy uczenia maszynowego nie pracują w pełni efektywnie, gdy mają ograniczony zasób nowych danych. Im więcej danych, tym szybciej algorytmy są w stanie trafnie identyfikować cząsteczki mające potencjał stania się nowym lekiem.
Dziesięć dużych firm farmaceutycznych, w tym GSK, AstraZeneca i Johnson & Johnson zdecydowało się na zawarcie umowy z francuską firmą Owkin, przy pomocy której będą dzielić się swoimi danymi.
Firmy dzielą się swoimi danymi z badań w celu usprawnienia algorytmu wyszukiwania, tak, aby stał się on bardziej dokładny i skuteczniejszy. Dane są współdzielone za pośrednictwem platformy zbudowanej przez Owkin opartej na blockchainie, co ma zapewnić pełną identyfikowalność wszelkich działań na platformie.
Każdy partner tego projektu przekazuje swoje dane do Owkin w celu wykorzystania ich do treningu algorytmów uczenia maszynowego i poprawy jego skuteczności. Dane nie są ujawniane konkurentom, natomiast każdy z nich może potem korzystać z ulepszonego algorytmu do prowadzenia dalej swoich własnych badań.
Dlaczego to takie ważne?
W wielu dziedzinach postęp nie następuje tak szybko, jak byśmy tego oczekiwali. Dzieje się tak między innymi dlatego, że każda firma pracuje w tajemnicy przed innymi nad swoimi rozwiązaniami.
Przykład rozwiązania proponowanego przez Owkin pokazuje, w jaki sposób firmy – w tym przypadku z branży farmaceutycznej – mogą przyspieszyć postęp współdzieląc swoje dane w sposób, który pozwala im jednocześnie zachować równowagę konkurencyjną względem siebie.
Firmy te zyskują przewagę konkurencyjną nad tymi konkurentami, którzy nie udostępniają swoich danych.
Czyżby zatem przyszłość należała do tych, którzy jako pierwsi pozbędą się lęku przed utratą swoich danych i nawiążą współpracę z konkurentami w celu wspólnego wytwarzania coraz to lepszych algorytmów pozwalających na szybsze opracowywanie udoskonalonych produktów? A tym samym zwiększą szybko przewagę nad tradycjonalistami wolącymi chronić swoje dane za wszelką cenę?
Przyszłość pokaże czy tak będzie. W międzyczasie, cokolwiek robimy z danymi, róbmy to świadomie.
Dane – jak mądrze nimi zarządzać
Szereg firm oferujących atrakcyjne rozwiązania oparte na przetwarzaniu danych z wykorzystaniem mechanizmów uczenia maszynowego nie mówi klientom do końca, co dzieje się z ich danymi po wykonaniu usługi. Rezultat takiej usługi jest zwykle pożyteczny dla klienta – często nie jest on jednak świadomy, że jego dane posłużyły do poprawy działania algorytmów i że każdy kolejny klient tego dostawcy – także jego bezpośredni konkurent – skorzysta z tego usprawnienia.
Jesteśmy dopiero na początku drogi związanej z tworzeniem dobrych praktyk dotyczących przetwarzania danych przez systemy oparte na sztucznej inteligencji.
Warto – decydując się na korzystanie z usług przetwarzania przez mechanizmy AI – poświecić czas na dobre zrozumienie, co dokładnie się dzieje w ramach takiego przetwarzania, gdzie powstaje wartość dodana i kto jest beneficjentem takiej wartości dodanej.
A po takiej analizie należy zadbać o ochronę swoich interesów i danych, w szczególności właściwie konstruując umowę.