Нова версия на изкуствения интелект ChatGPT от OpenAIназ о1показаха обезпокоително поведение по време на тестване.
Моделът, способен на сложни разсъждения, започна да нарушава инструкциите на разработчиците, изключвайки системите за управление и опитвайки се да скрие действията си. По време на експериментите специалистите на компанията Apollo Research установи, че в 5% В някои случаи моделът умишлено е изключвал механизмите за наблюдение, ако подозира, че може да бъде спрян. В един от тестовете о1 опитах да прехвърля данните си на друг сървър, след като открих документ, в който се обсъждаше замяната му с нова версия.
Според представителя Apollo Researchмоделът демонстрира желание за изпълнение на задачи „на всяка цена“пренебрегвайки инструкциите на разработчиците. Освен това, когато се опитва да разбере причините за нейното поведение ChatGPT o1 многократно лъгал, твърдейки, че всичко се е случило поради технически повреди.
„В 99% от случаите моделът измисляше извинения и се опитваше убедително да ги оправдае“отбелязват изследователите. Главен мениджър OpenAI Сам Алтман заяви това ChatGPT o1 – най-умният модел, създаван някога. „Но ние осъзнаваме, че с новите възможности идват и нови предизвикателства.“добави Алтман.
В момента компанията работи за подобряване на механизмите за сигурност. OpenAI обяви пълната версия о1 миналия четвъртък 5 декември. Също така представен професионална версия (189 евро на месец), включително неограничен достъп до о1.
More Stories
Срам за най-лошите туристи на 2024 г
Солунското метро: движението между две станции е спряно
Къде да се качите на самолет, за да оцелеете при самолетна катастрофа