Prof. Gelenbe o historii AI dłuższej niż hype, jej źródłach i granicach

Prof. Erol Gelenbe z Instytutu Informatyki Teoretycznej i Stosowanej PAN zajmuje się sztuczną inteligencją, sieciami komputerowymi i modelowaniem systemów od ponad pół wieku. W rozmowie z Akademią opowiada o początkach badań nad sieciami neuronowymi, problemach związanych z obecną popularnością AI oraz o tym, dlaczego Europa oddała kontrolę nad technologiami informacyjnymi amerykańskim firmom

Zajmuje się pan sztuczną inteligencją od czasów, gdy większość ludzi nie znała jeszcze tego pojęcia. Jak wyglądały początki badań nad AI i co w tej dziedzinie zmieniło się najbardziej?

Zająłem się tym właściwie przypadkiem, pod koniec lat 80. Byłem wtedy w Moffett Field, amerykańskiej bazie na południe od San Francisco, gdzie znajdują się ogromne tunele aerodynamiczne. Zaproszono mnie tam do pracy nad obliczeniami wysokiej wydajności. Przy okazji słuchałem seminariów o sieciach neuronowych.

Tego, co dziś nazywamy AI, wtedy tak nie określano. Sztuczna inteligencja oznaczała badanie ludzkiego rozumowania i metod pozwalających symulować je za pomocą komputerów. Powstawały systemy eksperckie, roboty i modele logicznego wnioskowania. To, co dziś wrzuca się do jednego worka pod nazwą AI, funkcjonowało raczej jako uczenie maszynowe albo obliczenia neuromorficzne.

Największa zmiana dotyczy jednak mocy obliczeniowej. Używamy odpowiedników superkomputerów, ogromnych zbiorów danych i bardzo dużych modeli matematycznych. Kiedy mówimy, że model jest trenowany, w praktyce dopasowujemy jego parametry do danych tak, aby możliwie dobrze odtwarzał znane zależności między wejściem a wyjściem. Cała dziedzina przesunęła się też od prób naśladowania ludzkiej inteligencji w stronę bardzo wyspecjalizowanych metod.

Duże modele językowe również nie są nowym wynalazkiem.

Pierwszym szeroko znanym systemem tego typu była w latach 60. ELIZA. Program miał około 420 linii kodu i symulował odpowiedzi psychoterapeuty podczas rozmowy z pacjentem. Wiele osób było przekonanych, że rozmawia z prawdziwym psychologiem. To pokazuje, że mechanizmy imitowania języka czy rozmowy istnieją od dawna, i nawet proste potrafią być bardzo przekonujące. 

Czym więc jest obecny szum wokół AI?

Jest niepokojący, bo miesza rzeczy prawdziwe z fałszywymi. Mówi się na przykład, że modele językowe pomagają pisać programy komputerowe. To prawda, ale zwykle nie dodaje się, że potem ktoś musi te programy bardzo dokładnie sprawdzić. Kod generowany przez modele zawiera błędy, pominięcia albo błędnie interpretuje problem. Czasem wynika to z nieprecyzyjnego opisu zadania, a czasem z ograniczeń samego modelu. W efekcie ilość ludzkiej pracy i kontroli wcale nie musi radykalnie maleć.

Programiści mówią jednak, że takie systemy są użyteczne, bo podpowiadają rozwiązania, na które człowiek mógłby nie wpaść. W pewnym sensie modele stały się ogromnymi bazami przykładów programów napisanych wcześniej przez ludzi, zmodyfikowanych przez inne programy komputerowe i przyswojonymi przez AI. 

Podobnie wygląda sytuacja z tekstami. Mówi się o „halucynacjach”, żeby brzmiało to łagodniej, ale to po prostu błędy statystyczne. Na uczelniach zdarzają się prace zawierające nieistniejące cytowania albo fałszywe przypisy wygenerowane przez AI. W całym szumie wokół sztucznej inteligencji mówi się głównie o zaletach, a znacznie rzadziej o kosztach i ograniczeniach, wtym ogromnych wydatkach na sprzęt komputerowy czy energię..

Historia tej technologii jest znacznie dłuższa, niż zwykle się wydaje. Na ile współczesna AI opiera się na odkryciach sprzed epoki komputerów?

Tak naprawdę zaczyna się jeszcze przed powstaniem informatyki. Pod koniec XIX w, Camillo Golgi opracował metodę barwienia tkanki nerwowej, która pozwoliła po raz pierwszy zobaczyć neurony pod mikroskopem. Uważał, że mózg działa dzięki całej strukturze połączeń, a nie pojedynczym komórkom. Drugą ważną postacią był Santiago Ramón y Cajal. Obaj otrzymali Nagrodę Nobla z medycyny w 1906 r. za badania nad układem nerwowym. Był też francuski badacz Louis Lapicque, który mierzył impulsy elektryczne w tkance nerwowej i opisał je równaniem matematycznym.

Dopiero później pojawiły się próby stworzenia modeli matematycznych sieci neuronowych. W latach 40. Warren McCulloch i Walter Pitts zaproponowali deterministyczny model sieci neuronowej, który do dziś pozostaje fundamentem wielu systemów. To zresztą ciekawa historia, bo Pitts praktycznie nie miał stałej posady akademickiej. Obaj funkcjonowali trochę na obrzeżach świata nauki i utrzymywali się dzięki wsparciu profesorów z MIT, którzy uważali ich za wyjątkowo zdolnych. Otrzymywali niewielkie środki, aby mogli pracować i nie martwić się o przetrwanie.

Później, w 1974r., Paul Werbos opracował w ramach swojej pracy doktorskiej na Harvardzie algorytm wstecznej propagacji błędu. To jedna z podstaw współczesnego uczenia sieci neuronowych. Werbos również nie pasuje do stereotypu gwiazdy Doliny Krzemowej. Większość kariery spędził jako menedżer programów badawczych, rozdając granty innym naukowcom, w tym mnie. Był bardzo spokojnym, uśmiechniętym człowiekiem, bez potrzeby robienia wokół siebie rozgłosu. 

Jak zaczęła się Pana praca nad sieciami komputerowymi i jakie problemy były wtedy kluczowe?

To było na początku lat 70., kiedy pracowałem we francuskim INRIA. Obok mojego biura pracował Louis Pouzin, jedna z osób odpowiedzialnych za rozwiązania, które później stały się fundamentami Internetu. Zaczęliśmy od modeli kolejkowych dla systemów telefonicznych. Chodziło o to, aby zamiast bardzo kosztownych i powolnych symulacji komputerowych tworzyć modele matematyczne pozwalające przewidywać zachowanie sieci.

Później zajmowałem się projektowaniem przełączników komunikacyjnych i problemami transmisji danych. Jedna z rzeczy, nad którymi pracowaliśmy, dotyczyła sytuacji dobrze znanej dziś z Wi-Fi czy Ethernetu. Różne urządzenia próbują nadawać dane jednocześnie i wzajemnie się zakłócają.

Pokazaliśmy matematycznie, że kluczowym problemem nie jest samo ustalanie harmonogramu transmisji, ponieważ idealna synchronizacja jest niemożliwa, lecz to, jak systemy reagują po „zderzeniu” transmisji i wzajemnych zakłóceniach. Opracowaliśmy i udowodniliśmy działanie algorytmu ponownego przesyłania danych po kolizji, który gwarantuje stabilność systemu i maksymalizuje jego przepustowość komunikacyjną. Wynalazłem również losową sieć neuronową, opisującą sposób komunikacji neuronów u ssaków, oraz stworzyłem kilka powiązanych algorytmów uczenia. Inne opracowane przeze mnie modele matematyczne stały się podstawą badań prowadzonych w Polsce (i innych krajach) od lat 80. aż do dziś.

Jak trafił Pan do Polskiej Akademii Nauk?

W 2013 roku zostałem wybrany członkiem zagranicznym PAN. Pracowałem wtedy w Imperial College London, ale miałem już wcześniej wieloletnie kontakty z polskimi naukowcami, zwłaszcza z prof. Tadeuszem Czachórskim. Kiedy zaczął się Brexit, stało się jasne, że taka współpraca  będzie trudniejsza. Wtedy przeniosłem swoje granty europejskie do Instytutu Informatyki Teoretycznej i Stosowanej PAN i przeszedłem tam na pełny etat. Dziś prowadzę projekty europejskie, pracuję ze studentami doktoranckimi i rozwijam kolejne badania związane między innymi z cyberbezpieczeństwem oraz Internetem rzeczy.

Czym różni się praca naukowa w Polsce od pracy w Wielkiej Brytanii?

Różnic jest sporo. W Polsce bardzo ważny jest system oceny publikacji. Instytuty i naukowcy są oceniani między innymi na podstawie liczby punktów za artykuły. W Wielkiej Brytanii większe znaczenie mają granty i ogólna jakość badań, a nie punktacja publikacji.

Inny jest też sposób zatrudniania ludzi w projektach. W Polsce członkowie zespołu są zwykle pracownikami instytutu. W Wielkiej Brytanii postdoktorzy czy badacze bywają zatrudniani wyłącznie na czas konkretnego projektu.

Duże znaczenie ma także  relacja z Unią Europejską. Moje badania są finansowane z europejskich grantów i po Brexicie stało się jasne, że łatwiej będzie prowadzić je z kraju należącego do UE.

 Czy Europa przespała moment, w którym mogła zbudować własną suwerenność technologiczną?

Światowe rynki są zdominowane przez amerykańskie firmy, takie jak Microsoft, Google czy Nvidia, a realna konkurencja przychodzi głównie z Chin. Nie oznacza to jednak, że Europa utraciła kompetencje naukowe. Problem polega na tym, że technologie informacyjne przez lata traktowano w Europie bardziej jako sektor usług niż strategiczny przemysł. Tymczasem są one strategiczne tak samo jak lotnictwo czy energetyka.

„Dobrym przykładem jest Airbus. Firma powstała dlatego, że Francja i Niemcy dysponowały odpowiednim know-how i zdecydowały się zainwestować ogromne środki w stworzenie europejskiego konkurenta dla Boeinga. Początkowo był to kosztowny projekt polityczny i przemysłowy. Dziś Airbus jest bardzo rentowny i dominuje w sektorze lotniczo-kosmicznym. W sektorze obronnym Europa również ma wiele zaawansowanych technologicznie i odnoszących sukcesy firm, takich jak Dassault Aviation, MBDA, Rheinmetall, BAE Systems, Saab, Thales Group czy Leonardo.

Francja jest samowystarczalna w cywilnym i komercyjnym sektorze energetyki jądrowej.

Holandia posiada firmę ASML, dominującego na świecie dostawcę technologii fotolitografii do produkcji chipów. Spółka kontroluje około 90 proc. rynku i ma monopol na maszyny wykorzystujące litografię w skrajnym ultrafiolecie (EUV).

Z informatyką i AI Europa musiałaby zrobić coś podobnego.

Jaki jest dziś największy nierozwiązany problem informatyki?

Za bardzo skupiamy się na oprogramowaniu. Tymczasem dla Europy jednym z najważniejszych wyzwań jest odzyskanie kontroli nad sprzętem komputerowym. Amerykanie nigdy jej nie oddali, a Chiny zbudowały własne możliwości.

Drugie wyzwanie jest bardziej fundamentalne. Musimy wrócić do prób zrozumienia procesów poznawczych i połączyć je z osiągnięciami uczenia maszynowego. Dzisiejsza AI to głównie bardzo zaawansowane dopasowywanie statystyczne. To potężne narzędzie, ale nie wyczerpuje całego problemu inteligencji.

Prof. Erol Gelenbe jest informatykiem, inżynierem i matematykiem związanym z Instytutem Informatyki Teoretycznej i Stosowanej PAN. Urodził się w Stambule, studiował w Turcji, Stanach Zjednoczonych i we Francji. Pracował m.in. na Uniwersytecie Michigan, University of Liège, Université Paris-Saclay, Duke University, University of Central Florida i Imperial College London, gdzie kierował badaniami nad inteligentnymi systemami i sieciami. Jest twórcą m.in. modeli G-networks i Random Neural Network, wykorzystywanych w badaniach nad sieciami komputerowymi, uczeniem maszynowym i wydajnością systemów. Od 2013 r. jest członkiem zagranicznym Polskiej Akademii Nauk, a po Brexicie przeniósł swoje europejskie granty do IITiS PAN w Gliwicach. Kierował i współtworzył projekty UE dotyczące cyberbezpieczeństwa, Internetu rzeczy i infrastruktury sieciowej. Jest laureatem m.in. ACM SIGMETRICS Life-Time Achievement Award, Mustafa Prize oraz francuskiej Legii Honorowej. W 2024 roku otrzymał także Krzyż Oficerski Orderu Zasługi Rzeczypospolitej Polskiej za wybitne zasługi dla rozwoju polsko-międzynarodowej współpracy naukowej. W 2025 roku został pierwszym europejskim informatykiem lub inżynierem wybranym na zagranicznego członka Indian National Science Academy, a także otrzymał IEEE Excellence Award od Technical Committee on Scalable Computing.

Przejdź do treści