Trwają zapisy na kursy on-line - semestr 23/24 r. Zapisz się na zajęcia >

Strona główna » Blog » Czy właśnie wpadamy w sidła sztucznej inteligencji?

Czy właśnie wpadamy w sidła sztucznej inteligencji?

Tytuł brzmi strasznie? No dobra, taki mały clickbait 😊, ale nie da się ukryć, że sztuczna inteligencja kryjąca się za kreatorem obrazów DALL-E 2 rzeczywiście jest niesamowitym krokiem do przodu. Choć z drugiej strony, przyglądając się niektórym wynikom wiemy, że jeszcze nic nam nie grozi. No chyba, że boimy się tego i że sztuczna inteligencja będzie nie do końca inteligentna i stworzy niepokojące rzeczy, takie jak niektóre z obrazów DALL-E 2. Ale od początku, bo to za dużo informacji w tak krótkim wstępie.

Czym jest i co robi DALL-E 2?

DALL-E 2 to najpopularniejszy obecnie generator obrazów. Całość polega na tym, że wpisujemy, co dokładnie chcemy otrzymać, a on w kilka sekund tworzy swoje „dzieło”. Należy pamiętać, że mówiąc „dokładnie”, naprawdę o to chodzi. Lepiej jest opisać każdy wymagany przez nas szczegół, łącznie z tym, jaki styl ma mieć otrzymana grafika.

Czyli robimy dokładnie to, co dzieje się w kodowaniu, tylko „ludzkim” językiem. Podczas zajęć z programowania dla dzieci mówimy o tym, że kodowanie to dawanie dokładnych instrukcji… i tu trzeba zrobić to samo, aby komputer nas zrozumiał. Chociaż w przypadku DALL-E 2 nie potrzebujemy znać języka programowania.

I tyle. W sumie to banalnie proste. Wpisujemy, co chcemy zobaczyć, a DALL-E 2 tworzy nam 4 obrazy do wyboru i możliwości tworzenia kolejnych na podstawie wybranej przez nas grafiki, jako przybliżenie oczekiwanego efektu. Czy w takim razie DALL-E 2 jest rzeczywiście inteligentny i rozumie nasz potoczny język? No niekoniecznie.

Jak działa DALL-E 2?

Nie będziemy tu zagłębiać się w meandry kodowania i działania programu, tylko opiszemy wszystko w prosty sposób.

Użytkownik podaje opis obrazu, a AI przelicza w olbrzymim tempie zmienne, takie jak pojedyncze słowa, a także całe zlepki zdania oraz wyrażenia, które łączą się ze sobą w opisie. Na tej podstawie sprawdza miliony obrazów z sieci. Co to znaczy?

– wyszukuje obraz dotyczący każdego słowa zawartego opisie, szukając do nich najlepszego odwzorowania w pewien statystyczny sposób,

– wyszukuje całe zlepki słów w opisach analizowanych obrazów i określeń, i robi z nimi dokładnie to samo, co powyżej,

– tworzy przestrzeń i podejmuje próby umieszczenia wybrany wizualizacji w odpowiedni sposób, według przesłanych instrukcji.

Jest to oczywiście wszystko opisane tak, że niejeden programista złapałby się za głowę, ale w ten sposób nawet laicy mogą sobie mniej więcej wyobrazić, jak działa DALL-E 2 oraz sztuczna inteligencja i uczenie maszynowe.

Czy DALL-E 2 zastąpi artystów?

Oj, zdecydowanie nie ma się na razie co bać, a dzieciaki uczęszczające na nasze zajęcia z grafiki komputerowej, mogą spokojnie uczyć się jej tworzenia, bez obaw o zastąpienie ich w najbliższym czasie przez sztuczną inteligencję.

DALL-E 2 pokazuje, że jednak AI nie rozumie jeszcze modelowania takich podstawowych elementów, jak twarze i nie tylko. Przyjrzyjcie się obrazom, które wygenerowaliśmy i załączyliśmy do wpisu. Już one pokazują, że DALL-E 2 nie radzi sobie na przykład z obrazem klawiatury i wszystkie one mają zniekształcone klawisze.

Dodamy, że umieszczone w tym wpisie „dzieła” były za każdym razem wybierane z 4-12 najlepszych wygenerowanych obrazów. Dużej liczby z nich nie wzięliśmy, bo mogą przyczynić się do koszmarów, i to nie przesada. Zniekształcone twarze zarówno ludzkie, jak i zwierzęce… Tworząc „kota programistę” na 8 obrazków, 3 koty wyglądały po prostu przerażająco. A jak wychodzą ludzie? Macie przykład.. i to jeden z zaledwie kilku, które akurat nie były jak z horroru.

DALL-E 2 lepiej radzi sobie z abstrakcją i tworzeniem ilustracji, oraz sztuki cyfrowej niż ze zdjęciami. Jednym słowem ta „nierzeczywistość” jest chyba jednak łatwiejsza dla sztucznej inteligencji. Grafiki 3D wychodzą… powiedzmy na czwórkę z minusem. Choć piesek z “włóczkowych baloników” wyszedł naprawdę fajnie i to już za pierwszym razem.

W czasie generowania obrazów DALL-E 2 „reklamuje” swoje możliwości gotowymi grafikami, kiedyś stworzonymi przez program. I szczerze mówiąc ciężko w to uwierzyć, gdyż starając się wpisywać analogiczne do tych przykładów opisy, grafiki pozostawiały wiele do życzenia. Zdecydowanie nie był to taki poziom, jak te prezentowane dla zachęty. Być może wymagały one setek prób, ale nie byliśmy w stanie tego przetestować na próbnej, bezpłatnej licencji, która mocno ogranicza liczbę tworzonych grafik.

Nie tylko obrazy…

Będąc przy DALL-E 2 należy też wspomnieć o wysypie różnego rodzaju AI, służącego do generowania tekstu. Pojawiły się już pytania, analogicznie do obrazów, czy sztuczna Inteligencja zastąpi pisarzy? Otóż tak jak w przypadku DALL-E 2 możemy odpowiedzieć – spokojnie, mamy jeszcze wiele czasu.

Programy generujące tekst radzą sobie (i to powiedziane na wyrost) z prostymi, kilkuzdaniowymi, ogólnymi opisami. Chcąc napisać wpis na bloga, otrzymujemy zazwyczaj papkę, której czytać się nie da. Na przykład powtarzające się co kawałek, to samo zdanie. Znów trochę lepiej wychodzi abstrakcja i próby tworzenia poezji.

To że AI czerpie z Internetu można zobaczyć, gdy czasem zabraknie mu tej abstrakcyjności. Na przykład pisząc tekst o ulubionych smakach czekolad, możemy otrzymać informacje o wynalezieniu czekolady i jej nazwie… i jest to data powstania i nazwa jednej z najbardziej znanych firm, a nie przysmaku jako takiego. No cóż, sztuczna inteligencja znalazła jakąś datę w sieci, powiązaną tematycznie i uznała za datę za właściwą dla „powstania” czekolady.

Buntu maszyn nie będzie!

A przynajmniej jeszcze nie teraz i zdecydowanie nie za szybko. No chyba że będą nas chciały wykończyć, serwując nam powykrzywiane mordki kapibary w turbanie na 3D grafikach. Czy damy radę osiągnąć coś więcej niż serwuje się nam teraz? Pewnie tak, ale będzie to powolny proces. Może artyzm uda się „wbić do głowy” AI dopiero kolejnemu pokoleniu, na przykład naszym obecnym uczniom.

Jednak lepiej, by zajęli się oni rozwojem sztucznej inteligencji w kierunkach mających na celu ratować życie i poprawiać jego komfort, a ewentualnie tworzenie cyfrowego Matejki zostawią sobie na czas wolny.


Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *