Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Charlie Kirk (1993-2025), morderstwo wschodzącej gwiazdy… z ostatniej chwili
Charlie Kirk (1993-2025), morderstwo wschodzącej gwiazdy…

Mówią o nim, że był apostołem Jezusa Chrystusa. Chciał prowadzić dialog z ludźmi o przeciwnym światopoglądzie dla urzeczywistnienia wartości jakie wyznawał i dla dobra przyszłości pogrążonej w wewnętrznym konflikcie Ameryki, która przestaje wierzyć w “american dream”, który przeradza się w “scream”

Jest nowy komunikat Dowództwa Operacyjnego Rodzajów Sił Zbrojnych z ostatniej chwili
Jest nowy komunikat Dowództwa Operacyjnego Rodzajów Sił Zbrojnych

Dowództwo Operacyjne Rodzajów Sił Zbrojnych poinformowało w niedzielę, że podjęte w sobotę działania wojska nie potwierdziły naruszenia polskiej przestrzeni powietrznej. Wszystkie decyzje miały na celu zapewnienie maksymalnego bezpieczeństwa obywatelom - podkreślono w komunikacie.

Nowy sondaż. Czego boją się Niemcy po wtargnięciu rosyjskich dronów w polską przestrzeń? z ostatniej chwili
Nowy sondaż. Czego boją się Niemcy po wtargnięciu rosyjskich dronów w polską przestrzeń?

Po wtargnięciu rosyjskich dronów w polską przestrzeń powietrzną, większość Niemców obawia się ataku Rosji na państwo NATO, takie jak Polska lub Litwa, w najbliższej przyszłości – wynika z sondażu przeprowadzonego przez instytut badania opinii publicznej INSA na zlecenie „Bild am Sonntag”. Według sondażu takiego ataku obawia się 62 proc. ankietowanych. 28 proc. nie podziela tych obaw.

Wspaniały sukces polskiego boksu. Mamy złoto i srebro, ale na tym nie koniec Wiadomości
Wspaniały sukces polskiego boksu. Mamy złoto i srebro, ale na tym nie koniec

Agata Kaczmarska w kategorii +80 kg zdobyła złoty, a Julia Szeremeta w 57 kg srebrny medal bokserskich mistrzostw świata w Liverpoolu. W niedzielę o tytuł powalczy Aneta Rygielska (60 kg).

To między innymi on doprowadził do lewitacji magnetycznej pierwszego żywego organizmu w historii [VIDEO] gorące
To między innymi on doprowadził do lewitacji magnetycznej pierwszego żywego organizmu w historii [VIDEO]

By to zrealizować, całe miasto musiało mieć ograniczony dostęp do energii. Dlatego eksperyment przeprowadzono w nocy. Dziś gościem naszego pierwszego w historii kanału „wywiadu rzeki” jest Laureat Nagrody Ig Nobla, Medalu Lorentza, Medal Diraca i Nagrody Wolfa w dziedzinie fizyki, sir Michael Berry.

Bartosz Zmarzlik ponownie mistrzem świata w żużlu z ostatniej chwili
Bartosz Zmarzlik ponownie mistrzem świata w żużlu

Bartosz Zmarzlik po raz kolejny zapisał się w historii polskiego sportu, zdobywając tytuł mistrza świata na żużlu. Polak potwierdził swoją dominację w sezonie, triumfując w klasyfikacji generalnej i zdobywając najwyższe trofeum w światowym speedwayu.

Świat zapomniał o sowieckich zbrodniach. A najszybciej zapomnieli Rosjanie tylko u nas
Świat zapomniał o sowieckich zbrodniach. A najszybciej zapomnieli Rosjanie

O zbrodniach i bestialstwach sowieckich, które miały miejsce na Polakach od 17 września 1939 roku, zapomniał nie tylko świat, ale również współczesne pokolenia Polaków. Tylko nieliczne osoby przypominają o tych wydarzeniach, traktując je jako przestrogę przed zagrożeniem, które wciąż istnieje i pozostaje aktualne. Nikt również nie porusza kwestii odszkodowań od Rosji.

Radna Platformy zaatakowana w Gdańsku przez taksówkarza-imigranta Wiadomości
Radna Platformy zaatakowana w Gdańsku przez taksówkarza-imigranta

Sylwia Cisoń, radna Gdańska, przeżyła dramatyczną sytuację w Gdańsku. Kierowca jednej z aplikacji przewozowych zaatakował ją gazem pieprzowym po tym, jak zwróciła mu uwagę, że pomylił trasę i wysadził pasażerów w niewłaściwym miejscu. Dodatkowo kierowca nie znał języka polskiego, co wskazuje, że był cudzoziemcem, imigrantem.

Komunikat dla mieszkańców Lublina z ostatniej chwili
Komunikat dla mieszkańców Lublina

Ponad 30,5 tys. dzieci i młodzieży weźmie udział w eksperymentach, warsztatach i wykładach przygotowanych w ramach XXI Lubelskiego Festiwalu Nauki. Impreza popularyzująca naukę rozpoczęła się w sobotę i potrwa do przyszłego piątku.

Iga Świątek opublikowała wpis. Internauci nie kryją radości Wiadomości
Iga Świątek opublikowała wpis. Internauci nie kryją radości

Po intensywnym lecie i krótkim odpoczynku Iga Świątek ponownie wraca na korty. Liderka światowego rankingu wylądowała w Seulu, gdzie rozpocznie kolejny etap azjatyckiej części sezonu.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane
Emerytury
Stażowe