Sztuczna inteligencja pisze książki

dr Grzegorz Osiński

Ideologia transhumanizmu w praktyce

Globalne wydawnictwo Kogan Page 3 marca br. wydało książkę pod tytułem „Modernizacja nadczłowieka: przekształcanie biznesu dzięki sztucznej inteligencji” (Superhuman Innovation: Transforming Business with Artificial Intelligence).

Dylematy prawne

Chociaż na okładce widnieje nazwisko Chrisa Duffeya, szefa rozwoju przestrzeni korporacyjnej Adobe Creative, to jednak nie jest on jedynym autorem książki. Można go raczej potraktować jako dziennikarza, który prowadzi wywiad rzekę z algorytmem sztucznej inteligencji nazwanym AIME. Rodzaj żeński tej cyfrowej asystentki pochodzi od francuskiego słowa „uwielbiany” (bien aimé), a symbolicznie stanowi połączenie skrótu określającego sztuczną inteligencję (artifical intelligence) oraz francuskiego słowa „ja”.

Chris Duffey twierdzi, że ta specyficzna gra słów ma określać cel zaprojektowania AIME jako „ukochanej, osobistej asystentki człowieka”. Nadanie bardzo emocjonalnych cech ludzkich algorytmowi sztucznej inteligencji to typowe działanie zwolenników ideologii transhumanizmu. Taka humanizacja ma na celu przyzwyczajenie ludzi do codziennej obecności algorytmów AI w ich życiu. Dlaczego jednak nie wymieniono AIME jako współautorki książki? Przecież pomogła ona człowiekowi napisać długi tekst na swój temat…

Jednym z powodów są prawa autorskie, obecnie ustawa chroni prawa autorskie do utworów wytworzonych przez człowieka. Nie za bardzo wiadomo, jak działałoby to prawo, gdyby autorem był algorytm sztucznej inteligencji, istnieją nawet interpretacje, które twierdzą, że takie utwory nie byłyby w ogóle objęte prawem autorskim. Zatem ochrona majątkowa również przestałaby obowiązywać, a książka napisana przez AIME stałaby się niczyja – nikt nie mógłby otrzymać honorarium za jej napisanie.

Pozostaje też kwestia odpowiedzialności za zawartość merytoryczną tekstu, autor musi się liczyć z konsekwencjami, jeśli np. poda nieprawdziwe informacje. Kto zatem miałby odpowiadać za treść utworu, jeśli jego autorem byłby algorytm sztucznej inteligencji? Firma, która zbudowała i uruchomiła taki algorytm? Czy też może poszczególni programiści, którzy brali udział w jej tworzeniu? Dzisiaj takie skomplikowane programy AI powstają tylko w bardzo dużych zespołach specjalistów, nierzadko kilkudziesięcioosobowych. Jak znaleźć ewentualnego „winnego”? To bardzo trudny problem i aby go zrozumieć, musimy prześledzić proces rozwoju takich technologii.

Zimna wojna a AI

Pierwsze poważne próby zastosowania metod sztucznej inteligencji do analizy języka naturalnego podjęto pod koniec lat sześćdziesiątych ubiegłego wieku. Był to szczytowy moment zimnej wojny i amerykańskie służby specjalne chciały wykorzystać AI do szybkiego i sprawnego tłumaczenia na angielski tekstów w języku rosyjskim, zdobytych w ramach działań operacyjnych wywiadu. Chociaż algorytmy działały bardzo szybko – a o to głównie chodziło Amerykanom – to jednak jakość tłumaczenia była bardzo zła. Język naturalny jest tak złożony, że algorytmy okazały się nieskuteczne, nie potrafiły sobie poradzić nawet z prostymi tekstami.

Musiało minąć prawie pół wieku, aby informatycy stworzyli zupełnie nowe narzędzie służące do analizy tekstów napisanych w języku naturalnym. W 2012 roku powstały systemy uczenia maszynowego (machine learning), które dosłownie uczyły się semantyki języka, analizując kolejne porcje tekstu i sprawdzając poprawność ich tłumaczenia. Ten automatyczny proces pozwalał algorytmom „uczyć się na własnych błędach”. Aby było to możliwe, algorytmy zostały zaprojektowane na wzór struktur występujących w ludzkim mózgu, a do ich implementacji wykorzystano metodologię sieci neuronowych. Powstały wtedy wydajne systemy nie tylko analizujące napisane teksty, ale również umożliwiające analizę ludzkiego głosu, oraz syntezatory symulujące ludzką mowę, łącznie z jej zawartością emocjonalną w postaci drobnych błędów, intonacji, akcentów oraz przypadkowych pauz i skrótów. Algorytmy takie były w stanie dostosować się do wytworów konkretnego człowieka i naśladować zarówno jego naturalną mowę, jak i styl literacki.

Cyfrowi asystenci

Takie właśnie algorytmy zastosowano przy projektowaniu AIME, tworząc samouczący się autonomiczny system. Składa się on z trzech elementów: modułu rozpoznawania ludzkiej mowy, procesora rozpoznawania treści wypowiedzi oraz generatora komunikatów zwrotnych, zarówno w formie dźwiękowej, jak i tekstowej. Z AIME można rozmawiać, posługując się językiem naturalnym.

Każdą analizowaną wypowiedź AIME porównuje z dostępnymi dla niej bazami danych, artykułami z prasy naukowej wszystkich indeksowanych czasopism naukowych, a następnie generuje swoją wypowiedź, w zależności od okoliczności analizując nastrój interlokutora, stosując odpowiednie etykietowanie oraz konstruując kontekst wypowiedzi. Na końcu odpowiedni system algorytmów wprowadza do tworzonego tekstu ludzkie wzory procesu pisania i tworzenia artykułów w zależności od potrzeb i preferencji ludzkiego rozmówcy. Zatem AIME to w zamyśle idealna asystentka pisarza lub dziennikarza, która może stworzyć dowolny tekst na zadany temat lub pomóc człowiekowi w jego pracy twórczej.

Nie zapominajmy, że może ona w ciągu kilku minut przeanalizować olbrzymie ilości informacji, których żaden człowiek nie będzie w stanie przeczytać nawet przez całe swoje życie. Ona niczego nie zapomina, wszystkie próby i wypowiedzi ma zapisane w przepastnych zasobach swojej binarnej pamięci. W czasie pracy nad książką „Modernizacja nadczłowieka” pomagała stworzyć koncepcję dzieła, przygotowywała materiały źródłowe oraz sama tworzyła całe partie tekstu. W książce tej na ponad 200 stronach szczegółowo opisany jest proces pracy AIME i przedstawione są jego efekty. Według recenzentów dowodzi to, że sztuczna inteligencja będzie przewyższać „ludzką siłę roboczą” pod każdym względem, nawet intelektualnym. Spowoduje to rewolucyjne innowacje w firmach i uzyskanie przewagi konkurencyjnej przez firmy, które stosują w swojej pracy technologie AI.

Tworzenie języka

Podstawowym modułem AIME, umożliwiającym jej porozumiewanie się ze „światem ludzi”, jest metoda tworzenia języka naturalnego (Natural Language Generator). To bazujący na zaawansowanych metodach lingwistycznych system obliczeniowy pozwalający konwertować w czasie rzeczywistym treści dostępne w otoczeniu AIME i na ich podstawie tworzyć wypowiedzi czytelne dla człowieka. Takie generatory od 2017 roku wykorzystuje się już w brytyjskiej agencji prasowej Press Association, są one określane skrótem Radar (Reporters and Data and Robots). Stosowanie algorytmów sponsorował należący do koncernu Google fundusz News Initiative – niebagatelną kwotą prawie miliona euro.

Pomysł był prosty, chodziło o dostarczanie tekstów dla lokalnych wydań prasowych, na podstawie analizy Big Data tworzonych na zadany temat np. dotyczący sprawności służby zdrowia czy też aktywności lokalnych polityków. Okazuje się, że tylko pięcioosobowa ekipa reporterów wraz z dwoma informatykami wykorzystującymi algorytmy NLG jest w stanie „wyprodukować” miesięcznie 8 tysięcy tekstów prasowych, czyli ponad 250 tekstów dziennie! Tematyka tych artykułów jest bardzo zróżnicowana: od transportu, oświaty i problemów środowiska po ochronę zdrowia i politykę. Aby sprostać takim zadaniom w klasyczny sposób, należałoby zatrudnić kilkuset dziennikarzy, przy założeniu, że każdy z nich pisałby przynajmniej jeden artykuł dziennie. Nie należy się zatem dziwić, że w opinii specjalistów AI roboty dziennikarskie to przyszłość.

Perfekcyjny naśladowca

W lutym 2019 roku media światowe obiegła ważna informacja dotycząca amerykańskiej organizacji OpenAI, zajmującej się badaniami nad stosowaniem zaawansowanych metod sztucznej inteligencji. OpenAI ogłosiła, że stworzyła algorytm, który potrafi pisać w języku naturalnym teksty na dowolny temat z taką sprawnością, że są one nie do odróżnienia od utworów napisanych przez człowieka. Jednak ze względu na „potencjalne niebezpieczeństwo” niewłaściwego użycia tego algorytmu postanowiono go nie ujawniać. Zatem organizacja non-profit mająca w swoim statucie zapisaną konieczność tworzenia „otwartego oprogramowania” postanawia zamknąć swój najnowszy produkt w sejfie, razem ze wszystkimi tekstami, jakie zdoła on stworzyć. Dlaczego?

Oficjalnie na stronie internetowej OpenAI (https://openai.com/progress/) możemy znaleźć komunikat, który stwierdza: „Nowy model sztucznej inteligencji zwany GPT2 jest tak dobry, a ryzyko złośliwego użycia jest tak wysokie, że musimy wyłamać się z naszej normalnej praktyki upubliczniania jego kodu. Potrzebujemy więcej czasu na zbadanie konsekwencji tego przełomu technologicznego”. Cóż takiego niebezpiecznego może być w algorytmie, który potrafi pisać teksty w języku naturalnym?

Przypomnijmy sobie opisywany na początku artykułu problem prawny związany z uznaniem autorstwa algorytmu sztucznej inteligencji w przypadku napisania książki. Chodziło o ewentualne zyski wynikające z prawa autorskiego. Jednak istnieje dużo poważniejszy problem, związany z odpowiedzialnością za treść stworzonego dokumentu. Algorytm potrafi stworzyć bardzo sugestywne historie, które mogą się wydawać autentyczne, choć zostały oparte na nieistniejących faktach. Dokładna analiza tekstów stworzonych przez GPT2 wykazała, że chociaż były one napisane perfekcyjnym językiem, z użyciem dobrej stylistyki, to jednak znaleziono w nich cytaty, które były fałszywe. Zatem algorytm nauczył się kłamać.

Pierwsze testy GPT2 były wykonywane na bazie 8 milionów dokumentów napisanych przez człowieka i dostępnych zazwyczaj w sieciowych zasobach cyfrowych. Wśród tych dokumentów występowały również wpisy i komentarze z serwisów społecznościowych, komentarze prasowe czy też treści z prywatnych stron internetowych. Na takich pozycjach program uczył się języka naturalnego człowieka. Z pewnością algorytm w wyniku metaanalizy odnotował, że w tekstach stworzonych przez człowieka, szczególnie tych o niskiej wartości, występują liczne nieścisłości, manipulacje i po prostu kłamstwa. Dlatego pojawiły się one również w tekstach stworzonych przez algorytm. Czy trzeba było tyle trudu, pieniędzy i pracy ludzkiej, aby stwierdzić oczywistą prawdę, że to, co jest w stanie stworzyć człowiek, zależy od tego, jakimi treściami literackimi został on „nakarmiony” w przeszłości?

Jeśli na co dzień poszukujemy prawdy, staramy się tworzyć rzeczy dobre i obcujemy z pięknem zawartym np. w tekstach literackich, to z pewnością jesteśmy w stanie stworzyć teksty, które będą odzwierciedleniem naszych doświadczeń. Będą one zawierały prawdziwe, dobre informacje. Ale jeśli nasza codzienność to kłamstwo i oszustwo, zamiast piękna otacza nas brzydota i ohyda, a w życiu poszukujemy tylko chwilowych przyjemności, to tak będą wyglądały również nasze „dzieła”. Algorytm sztucznej inteligencji, który został stworzony, aby naśladować inteligentne zachowania człowieka, odzwierciedla przecież nasze ludzkie cechy. Kiedy dokonał on analizy milionów dokumentów dostępnych w sieci, po prostu zaczął je naśladować.

Pole do manipulacji

Współcześnie w czasie kampanii wyborczych, konfliktów międzynarodowych bądź indukowanych niepokojów społecznych bardzo często stosowane są metody manipulacji czy też po prostu kłamstwa, nazywane eufemistycznie „fake newsami”. Kiedy te zjawiska powodują rzeczywiste problemy, zaczynamy mówić o „cyberzagrożeniach” czy też „wojnie informacyjnej”. Kiedy manipulacje i kłamstwa są tworzone przez ludzi, nawet w bardzo specjalistycznych ośrodkach dezinformacji, to mamy przynajmniej teoretyczną szansę dotarcia do źródeł i zweryfikowania nieprawdziwych informacji. Dużo gorzej jest, kiedy za takimi działaniami stoją wyspecjalizowane algorytmy AI, które są w stanie generować dziennie tysiące „newsów” opartych na mieszance prawdziwych i fałszywych informacji. Wtedy nawet najlepszy zespół analityków nie jest w stanie ich przeanalizować.

Oprócz tego inne algorytmy AI mogą zajmować się planowaniem i symulacją długofalowych strategii np. w polityce zagranicznej. Gdy połączymy cel strategiczny zaplanowany przez jeden algorytm ze sprawnością działania algorytmu tworzącego dezinformacyjne komunikaty to mamy gotową, sprawną metodę realizowania długofalowych działań o zasięgu światowym.

W styczniu tego roku brytyjski „The Guardian” opublikował film przedstawiający możliwości takiej strategii. Specjalny program AI potrafił tworzyć teksty dotyczące gorącego tematu: brexitu. Wystąpiły w nim stwierdzenia w bardzo dosadny sposób krytykujące postępowanie urzędników Unii Europejskiej, ale również negatywne oceny polityków angielskich. Język artykułu został określony jako bardzo brutalny, dlatego postanowiono go nie publikować. Zawierał on podobno bardzo wiele manipulacji. Algorytm piszący tekst uczył się metodą machine learning, mając jako zbiór referencyjny ponad 2 miliony publikacji prasowych z dzienników i tygodników „głównego nurtu”, miał zatem odpowiednich mistrzów dziennikarstwa.

Uczulenie społeczeństwa na manipulacje i kłamstwa medialne to bardzo ważne zadanie edukacyjne. Naukowcy z Uniwersytetu Stanforda przeprowadzili badania z udziałem około 8 tysięcy studentów, aby określić ich umiejętności w zakresie oceny wiarygodności informacji w sieci. Badania wykazały, że zdecydowana większość studentów nie posiada podstawowej umiejętności rozpoznawania wiarygodnych informacji i nie umie odróżnić treści sponsorowanych od prawdziwych artykułów.

Niezmiernie istotne są zatem działania edukacyjne, które wskażą nowe możliwe zagrożenia i pomogą, szczególnie młodym ludziom, odróżniać prawdę od kłamstwa w przekazie medialnym. Wyższa Szkoła Kultury Społecznej i Medialnej w Toruniu od bardzo dawna organizuje takie warsztaty dla młodzieży w ramach cyklu „Nowe Widnokręgi – zrozumieć media”. Konieczne jest jednak jeszcze uruchomienie odpowiednich specjalizacji na studiach informatycznych, które kształcić będą w zakresie inteligentnych systemów informacyjnych.

Źródło Nasz Dziennik

Dodaj komentarz