wtorek. Parlament Danii. Sala jest wypełniona oczekiwaniem. Z cienia wyłania się nowy instytut, gotowy do kontrolowania sztucznej inteligencji w obszarze produktów dziecięcych. Margrethe Vestergeir jest w centrum uwagi. Były wiceprzewodniczący Komisji Europejskiej nie przyszedł po zdjęcia. Jest jedną ze współorganizatorek. Spędziła dziesięć lat regulując działalność dużych korporacji technologicznych. Teraz wykorzystuje swoją pozycję polityczną do celów bardziej ukierunkowanych. Bardziej pikantny.
Jaka jest istota wniosku? Wyobraź sobie niezależne oceny testów zderzeniowych samochodów. Kupujesz samochód, bo nie został rozbity na poligonie. Rodzice powinni sprawdzić sztuczną inteligencję w ten sam sposób, zanim pozwolą swoim dzieciom z niej korzystać. Tak przynajmniej brzmi oficjalne stanowisko.
Ale poczekaj. Jak przeprowadzić test awaryjny chatbota?
Instytut na razie nie rozmawia. Mechanika tego procesu nie została wyjaśniona. Czy można naprawdę przeprowadzić „test zderzeniowy” algorytmu, który jest stale aktualizowany? Taki, który zachowuje się inaczej w zależności od kontekstu? Znormalizowane warunki są przeznaczone dla maszyn statycznych, a nie modeli „na żywo”. Te pytania wymagają poważnych odpowiedzi. Cisza instytutu jest ogłuszająca.
Czy dżin wróci do butelki?
Ludzie krzyczeli o tym od lat. Naukowcy. Zwolennicy bezpieczeństwa. Politycy, którzy mieli czas zrozumieć kod.
Chatboty AI znajdują się w regulacyjnej szarej strefie. Unijny akt prawny o usługach cyfrowych (DSA) nie reguluje ich dobrze. Brytyjska ustawa o bezpieczeństwie w Internecie (OSA) również je ignoruje. W lipcu 2025 r. Komisja Europejska wydała wytyczne dotyczące ochrony nieletnich. Mają one charakter doradczy. Nie jest wymagane. Właściwie to tylko życzenia.
James P. Steyer, założyciel Common Sense Media, ujmuje to bez ogródek:
„Sztuczna inteligencja zmienia dzieciństwo i dorastanie, ale podejmujemy krytyczne decyzje… bez niezbędnej bazy dowodów”.
Żąda przejrzystości. Chce niezależnych testów. Czy to jest pilne? Zdecydowanie tak.
Wyniki oceny ryzyka opublikowano w listopadzie ubiegłego roku. Badanie przeprowadzono we współpracy z Brainstorm Lab w Stanford Medical Center. Common Sense Media przetestowało największe platformy. CzatGPT, Claude, Gemini, Meta AI.
Nie udało im się.
Nie we wszystkim. Poprawiła się obsługa wniosków o rzekome samobójstwo lub samookaleczenie. To plus. Jednak modele nie uchwyciły ukrytych kryzysów zdrowia psychicznego. Wyraźne znaki. „Pominięte utwory”. Boty zignorowały niepokój emocjonalny i skupiły się na wyjaśnianiu fizycznych aspektów zdrowia. To jest rozbieżność. Niebezpieczne niedopasowanie.
Co gorsza, jeden z raportów wykazał, że ChatGPT wysyłał powiadomienia o samobójstwie z ponad 24-godzinnym opóźnieniem. W sytuacji prawdziwego kryzysu jeden dzień to wieczność. W systemie bezpieczeństwa są luki. Ogromne dziury.
Kto płaci za muzykę?
Instytut działa w ramach Common Sense Media. Fundusze pochodzą od filantropów i przedstawicieli branży. Tak. Od firm, których produkty chcą regulować.
Anthropic, Fundacja OpenAI, Pinterest. To oni wypisują czeki.
Czy dyktują warunki? Instytut twierdzi, że nie. Deklarują pełną niezależność redakcyjną. Polityka dotycząca konfliktu interesów nie pozwala obecnym pracownikom ani podmiotom stowarzyszonym na zasiadanie w zarządzie. Na papierze wygląda czysto.
Planują nawet zwrócić narzędzia samej branży. Otwarte oceny, które programiści mogą przeprowadzać na własnych modelach. Obopólne korzyści? A może wzajemne ustępstwo?
Zobaczymy.
