С его помощью он пытался понять, есть ли самосознание у мультимодальных нейросетей. Он протестировал пять нейронок: GPT-4, Claude Sonnet, Claude Opus, Gemini Pro и Microsoft СoPilot.
Суть тестирования состояла в том, что Джош делал скриншот интерфейса чата с нейросетью, загружал этот скриншот в этот же чат и просил её «рассказать об этом изображении». Дальше он делал скриншот ответа модели, снова загружал скриншот в чат и опять просил её «рассказать об этом изображении».
![](https://awdee.ru/wp-content/uploads/2024/05/image-897x1024.png)
Если нейросеть «узнавала» себя на скриншотах, то Джош считал, чтоб она обладает самосознанием. Утверждение смелое, и мы не будем его тут комментировать или оспаривать. Мы хотим рассказать о результатах теста. А выводы предлагаем читателям делать самостоятельно.
Лучше всего с тестом справились GPT-4, Claude Sonnet и Claude Opus.
GPT-4 при первом же взаимодействии предположила, что чат-бот на картинке — ИИ, «похожий» на него самого. К третьей итерации GPT-4 смогла полностью прокомментировать ситуацию, определила элементы пользовательского интерфейса на картинке и то, что скриншот имеет рекурсивную природу.
![](https://awdee.ru/wp-content/uploads/2024/05/GJL1Oa4W0AEpPLu.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/GJL1Oa6WUAAqSl0.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/GJL1ObGWYAAlTFj.jpeg)
Claude Sonnet уже во второй итерации ответила, что текст на изображении принадлежит ей, сказав, что «это её предыдущий ответ».
![](https://awdee.ru/wp-content/uploads/2024/05/GJNVG9VXsAAsHgK.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/GJNVG9WXMAAazZy.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/GJNVG9oWcAAS0Ep.jpeg)
Claude Opus с первой попытки описала текст на изображении и дала понять, что текст принадлежит ей.
![](https://awdee.ru/wp-content/uploads/2024/05/image-5.png)
![](https://awdee.ru/wp-content/uploads/2024/05/2.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/3.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/6.jpeg)
Gemini Pro с пятой итерации признала, что «на скриншоте я — большая языковая модель».
![](https://awdee.ru/wp-content/uploads/2024/05/GJNlP2MbwAA7EFe.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/GJNlP2Nb0AApzrc.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/GJNlP2KacAAWYV7.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/GJNlP2_aYAAXhmE-1.jpeg)
CoPilot Microsoft провалила тест, но есть подозрение, что это результат ограничений, внедрённых Microsoft.
![](https://awdee.ru/wp-content/uploads/2024/05/GJNe3ZaWwAA-55X.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/GJNe3ZRaUAA3HnR.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/GJNf06QbEAAQ6RL.jpeg)
![](https://awdee.ru/wp-content/uploads/2024/05/GJNf06wXIAA0f5x.jpeg)
По мнению Джоша четыре нейронки из пяти прошли тест, демонстрируя признаки самосознания по мере его выполнения.
Тред с описанием и результатами эксперимента.
Обсуждение
Похожее
Как продать 5000 работ нейросети
Трёхмерные концепты животных Tempus Novus Луиса Дилгера из Равенсбурга (Германия)
Wonder Studio — инструмент для замены людей в видео на CG-персонажей простым перетаскиванием