W dobie nowych technologii i coraz bardziej zaawansowanych systemów automatyzujących różne aspekty naszego życia, nikogo nie dziwi fakt, że w rosnącej liczbie czynności, człowieka z powodzeniem zastępuje maszyna.

Dzisiejsze modele sztucznej inteligencji, nie gorzej niż ludzki ekspert, rozpoznają obiekty na zdjęciach, diagnozują choroby, rozmawiają, czy nawet prowadzą samochód. Mimo, że jest to niewątpliwie fascynujące i warte dalszych badań, wielu z nas dopadają wątpliwości - czy nadejdzie taki czas, w którym okażemy się całkowicie zbędni? Czy charakteryzuje nas jakaś cecha, której maszyna nie może się nauczyć? Cóż, jedną z nich mogłaby być kreatywność. Maszyny coraz lepiej radzą sobie z udawaniem różnych funkcji naszego umysłu, ale czy są w stanie same coś stworzyć? Wydawałoby się, że twórczość jest jednym z przywilejów człowieczeństwa, czymś niepowtarzalnym w naturze. Nie do pomyślenia jest, że pisarze, malarze, muzycy, architekci, okażą się kiedyś niepotrzebni, a za dostarczanie rozrywki i kultury odpowiedzialny będzie system komputerowy. Chcemy, czy nie, taka przyszłość jest co najmniej prawdopodobna, a kolejny krok ku niej postawili inżynierowie uczenia maszynowego Andreas Refsgaard i Mikkel Thybo Loose, zakładając booksby.ai - księgarnie internetową, w której wszystkie elementy zostały wygenerowane przez modele sztucznej inteligencji.

booksby-books

Kilka książek z oferty booksby.ai

Sztuka bez udziału człowieka

Jeszcze raz to podkreślę, wszystko, co można zobaczyć w booksby.ai jest stworzone przez maszynę: książki, okładki książek, recenzje, zdjęcia recenzentów, a nawet ceny! Trzeba jednak podkreślić, że nie jest to literatura, która pochłania na długie godziny - teksty są często niezrozumiałe a zdania niepowiązane ze sobą nicią fabularną. Mimo wszystko książki autorstwa sztucznej inteligencji można nabyć na Amazonie, co więcej, możliwe jest zamówienie wersji drukowanej - ceny wahają sie w przediale 10-18 USD. Jedno z dzieł, pod tytułem ”The Imperfect in the Disaster” autorstwa Barreast Wolf, doczekało się ludzkiej, pięciogwiazdkowej recenzji, która w mojej opini trafnie podsumowuje, jak powinniśmy postrzegać projekt booksby.ai:

”The Imperfect in the Disaster to książka napisana i zaprojektowana w całości przez AI. Pięciogwiazdkowa ocena nie ma nic wspólnego z samą historią. Bez urazy dla autora, jest ona praktycznie nieczytelna.
Ocena wynika z mojego zdumienia faktem, że ta książka w ogóle istnieje. Jak fajnie by było, gdyby AI osiągneła tak wysoki poziom, że byłaby w stanie Cię poznać i stworzyć książkę specjalnie dla Ciebie? To pierwszy krok w tym kierunku. Ponadto, ”autor” nazywa siebie Barreast Wolf, co jest najfajniejszą nazwą jaką kiedykolwiek słyszałam.
Jeżeli ktoś jest zainteresowany, może odwiedzić Booksby.ai - stronę internetową poświęconą tej książce i wielu innym. Podstrona ”about” została napisana przez człowieka, ale reszta kontentu strony to robota AI. Nawet recenzje książek są wygenerowane przez AI, co jest miłym akcentem.”

Mimo niedoskonałości i braku większego sensu w historiach napisanych przez maszynę, trzeba przyznać, że zdania przez nią konstruowane są poprawne językowo, bez błędów ortograficznych, z pełną interpunkcją. Co więcej, w książkach naszych wirtualnych autorów znajdziemy również dialogi prowadzone przez różnych bohaterów, mających swoje unikatowe imiona i nazwiska. Muszę przyznać, że już w tej chwili robi to niesamowite wrażenie, jak na projekt który miał być jedynie zabawnym eksperymentem.

Książki napisane przez maszynę można kupić na Amazonie.

Jak to jest zrobione?

Do wygenerowania wszystkich elementów księgarni używano głebokich sieci neuronowych - szczególnego modelu uczenia maszynowego, inspirowanego budową ludzkiego mózgu. Sieci neuronowe okazały się najsilniejszym narzędziem do zastosowania w zadaniach naśladujących działanie naszego umysłu, dlatego chętnie są wykorzystywane w projektach i badaniach nad sztuczną inteligencją. Sieć ”uczy się” przez ”oglądanie” dużej ilości przykładów , co pozwala jej dostosowywać swoje parametry do danych, a następnie wykorzystywać wytrenowane parametry (zwane wagami) do pracy nad nowymi danymi. Jak można się spodziewać, istnieje niezliczona ilość różnych typów sieci neuronowych, które znajdują swoje zastosowania do różnych zadań - od problemów dotyczących języka do przetwarzania obrazów.

Do stworzenia okładek i zdjęć recenzentów wykorzystano architekturę Generative Adversarial Network (GAN). Jako że jest to szczególnie ciekawa koncepcja, chciałbym ją tu pokrótce wyjaśnić.

GAN to w rzeczywistości model złożony z dwóch, wzajemnie rywalizujących sieci neuronowych. Jedną z nich nazywamy Generatorem, a drugą Dyskryminatorem. Generator, na swoim wejściu przyjmuje wektor losowych liczb (tzw. szum), a na wyjściu zwraca wygenerowane zdjęcie. Zadaniem Dyskryminatora jest wydanie werdyktu, czy to zdjęcie jest fałszywe (czyli stworzone przez Generator), czy prawdziwe (należące do zbioru uczącego). Wspomniany proces przedstawiono na poniższej ilustracji:

Następnie, wagi parametry obu sieci są modyfikowane. Podsumowując, trening GAN’a można potraktować jako pewien rodzaj rozgrywki między dwiema sieciami neuronowymi, w której Generator chce zmylić rywala, tworząc zdjęcia nieodróżnialne od prawdziwych, a Dyskryminator – wykryć każdą próbę oszustwa. W ten sposób, po dobrze przeprowadzonym procesie uczenia, otrzymujemy w istocie dwa modele – jeden, który tworzy całkowicie nowe, nieistniejące wcześniej obrazy, oraz drugi – który potrafi odsiewać fake’i. Nie muszę chyba nikogo przekonywać co do przydatności ich obu, szczególnie w dobie social mediów 🙂

Zbiór uczący modelu zaprojektowanego przez autorów projektu, to około 10 000 różnych okładek książek science fiction pobranych z OpenLibrary. Natomiast do tworzenia zdjęć recenzentów, wykorzystano wytrenowaną już sieć GAN, szczegółowo opisaną tutaj.

 

Okładki tworzone przez uczący się Generator. 

Za tworzenie wszystkich tekstów (historii, recenzji, tytułów, autorów i opisów) odpowiedzialna była Rekurencyjna Sieć Neuronowa (Recurrent Neural Network – RNN). Jest to architektura sieci powszechnie używana do zadań dotyczących języka naturalnego. Trening takiej sieci polega na zasilaniu jej ogromną ilością danych tekstowych napisanych przez ludzi i szkoleniu do generowania własnego tekstu w tym samym stylu. Jako że komputerowo pisane powieści brzmią jak science fiction, autorzy uznali, że będą uczyć algorytm pisania właśnie w tym gatunku. Tak jak wspomniano, kluczem do sukcesu w uczeniu modelu sieci neuronowej jest jakość i wielkość zbioru uczącego. Tutaj autorom z pomocą przyszedł, cieszący się niemałą popularnością wśród pasjonatów uczenia maszynowego, Projekt Gutenberg – biblioteka ponad 60.000 darmowych ebooków, większości napisanych dziesiątki lat temu, których prawa autorskie już wygasły.

Do ustalenia cen książek zastosowano gotowy model z biblioteki ml5js.org. Został on wytrenowany na zbiorze (okładki książek + ich ceny) z Amazon.com.

Projekt booksby.ai powstał dla zabawy i jest wynikiem eksperymentu dwóch młodych developerów uczenia maszynowego. Pokazuje on możliwości, jakie komputerowe algorytmy oferują nam już dzisiaj, i jak można zauważyć, przy niewielkim nakładzie pracy. Mimo, że dzieła oferowane przez maszynę są bardziej urocze, niż wartościowe literacko, pozwalają nam snuć coraz śmielsze wyobrażenia o przyszłości, której, jako pasjonat sztucznej inteligencji i nowych technologii, z niecierpliwością oczekuję.

Żródła grafik wykorzystanych w artykule: