Взаимодействуя с большими языковыми моделями (LLM), мы всегда испытываем смутное ощущение, что они на самом деле могут быть сознательными. Однако, с точки зрения нейробиологов, эту точку зрения трудно придерживаться.
В недавней статье, опубликованной в Trends in Neurosciences, поджурнале Cell, трое ученых из области компьютерных наук, биологии и нейробиологии углубились в вопрос: «Может ли искусственный интеллект генерировать сознание?».
В заключение, они согласны с тем, что магистры права не могут быть сознательными в своей нынешней форме. Как возникла такая категоричная точка зрения?
▷Источник: Cell
LLM и сознание
Долгое время ставился вопрос о том, какие животные обладают сознанием и какие сущности обладают сознанием, кроме животных. Недавнее появление LLM привнесло совершенно новый взгляд на эту проблему. Она показывает нам нашу способность к общению (проявление человеческого сознания) и заставляет нас переопределить и переосмыслить три понятия «понимание», «интеллект» и «сознание».
LLM — это сложные, многослойные искусственные нейронные сети с миллиардами весов связей, обученные на десятках миллиардов слов текстовых данных, включая разговоры между людьми на естественном языке. Задавая вопросы с помощью текста, пользователь погружается в увлекательный смоделированный контекст. Если вы готовы потратить время на использование этих систем, трудно не быть пораженным глубиной и качеством сети. Задайте ему вопрос, и его ответ часто будет неуловимо похож на тот, который может задать сознательный человек. Поэтому, будучи проницательным, сознательным человеком, легко заключить, что ответы, которые я получаю, генерируются человеком, который также обладает «сознанием» и способен думать, чувствовать, рассуждать и переживать. **
Основываясь на результатах таких «тестов Тьюринга», мы не можем не задаться вопросом, обладают ли LLM уже сознанием, или они скоро станут сознательными? Однако этот вопрос, в свою очередь, приведет к ряду этических дилемм, например, этично ли продолжать разработку LLM, которые раз за разом находятся на грани пробуждения «сознания»? Идея о том, что LLM обладают «сознанием», сегодня не является общепринятой в нейробиологическом сообществе, но по мере того, как возможности систем ИИ продолжают совершенствоваться, обсуждение этой идеи неизбежно возвращается на первый план. Кроме того, основные средства массовой информации также широко обсуждают этот вопрос, побуждая нейробиологов объективно интерпретировать этот вопрос с собственной профессиональной точки зрения.
Идея о том, что LLM потенциально обладают сознанием, часто подкрепляется важным аргументом в пользу того, что архитектура LLM в значительной степени вдохновлена характеристиками мозга (рис. 1), и что мозг является единственным объектом, который мы можем с уверенностью отнести к «сознательным» в данный момент. В то время как ранние искусственные нейронные сети были разработаны на основе упрощенных версий коры головного мозга, современные LLM высокотехнологичны и адаптированы для конкретных целей и больше не сохраняют глубокую гомологию с известными структурами мозга. На самом деле, многие из функций, которые делают LLM вычислительно мощными (рис. 1), имеют архитектуру, сильно отличающуюся от систем, которые, как мы считаем в настоящее время, обладают причинно-следственной силой в генерации и формировании сознания у млекопитающих. Например, многие нейробиологические теории, связанные с генерацией сознания, предполагают, что таламо-кортикальная система и система возбуждения играют центральную роль в обработке сознания, что недоступно в современных LLM.
Рисунок 1: Макроскопические топологические различия между мозгом млекопитающих и большими языковыми моделями Источник: Тенденции в нейронауках
В этот момент можно спросить, так ли важно, чтобы архитектура LLM имитировала характеристики мозга?
На наш взгляд, основная причина заключается в том, что в данный момент мы можем быть уверены только в существовании одного сознания, которое исходит из мозга, встроенного в сложное тело. Кто-то может возразить, что, строго говоря, этот аргумент можно сузить до людей, хотя многие из черт системного уровня, которые, как считается, играют важную роль в субъективном сознании, преобладают во всем биологическом спектре, вплоть до млекопитающих и даже беспозвоночных.
С учетом сказанного, давайте начнем с точного значения слова «сознание». Затем мы представим три аргумента против идеи о том, что нынешние системы ИИ обладают или скоро будут обладать сознанием в будущем:
1. Сознание связано с потоком ощущений, значимых для организма;
2. В мозге млекопитающих сознание поддерживается тесно взаимосвязанной таламо-кортикальной системой;
**3. Сознание может быть неотделимо от сложной биологической организации биологических систем. **
Что такое сознание?
Сознание – сложное понятие, и его определение является дискуссионным. В контексте способности людей общаться и взаимодействовать друг с другом, способность к общению и диалогу является инстинктивным элементом, позволяющим оценить, обладает ли человек сознанием.
Языковые интерактивные беседы с магистрами права часто развивают интуитивное чувство, которое является отправной точкой для оценки того, может ли магистр права быть сознательным. Однако, несмотря на то, что магистры права отлично справляются с интерактивными беседами, это не соответствует формальному объективному критерию сознания, а является лишь предварительным свидетельством интеллекта. **
Появление LLM заставило нас переоценить, способен ли человек генерировать сознание непосредственно из вербальных взаимодействий с другими людьми. Таким образом, новая точка зрения заключается в том, что нам необходимо переформулировать критерии оценки человекоподобных способностей и человекоподобных характеристик.
Слово «сознание» часто имеет разные значения. Например, неврологи часто ссылаются на «уровень сознания», который является первой оценкой того, находится ли человек в сознании, а затем уровень или конкретное состояние сознания в более детальном виде. Психологов, с другой стороны, больше интересует содержание сознания: специфические переживания, воспоминания и мысли о внутреннем мире индивида. Кроме того, существуют различия между различными содержаниями сознания. Наш опыт может быть описан как феноменальный или эмпирический (например, когда мы видим или чувствуем запах яблока, или прикасаемся к своей руке) или в более абстрактной форме (например, как мы воображаем, представляем или манипулируем концептуальной памятью).
На вопрос о том, обладает ли система ИИ сознанием, можно ответить несколькими способами: она может сосредоточиться на некоторых значениях сознания или сосредоточиться на всех значениях сознания одновременно. Далее мы сосредоточимся в первую очередь на феноменальной осознанности и исследуем, способны ли машины феноменально воспринимать мир.
Об окружающей среде
Та часть организма, которая может быть использована в процессе восприятия окружающего мира, называется его окружением. Например, сетчатка человека реагирует на свет с длиной волны 380 нм – 740 нм, т.е. сетчатка способна воспринимать спектр от синего до красного. Без помощи внешних технологий человек не может обнаружить инфракрасный свет (>740 нм) или ультрафиолетовый свет (< 380 нм) за пределами этого диапазона длин волн. У нас также есть схожая среда с точки зрения слуха, соматосенсорных и вестибулярных чувств, а именно соответствующие слуховые домены (человеческое ухо может слышать звуки от 20 Гц до 20 000 Гц), соматосенсорные домены (люди могут различать стимулы с точностью до 1 мм от определенных частей тела) и вестибулярный домен (взаимосвязанные трехмерные структуры полукружных каналов человека обеспечивают нам внутреннее чувство равновесия). В то же время другие виды в природе способны обнаруживать сигналы в других диапазонах электромагнитного спектра. Например, пчелы могут видеть свет в ультрафиолетовом диапазоне, а змеи могут обнаруживать сигналы инфракрасного излучения в дополнение к более традиционным визуальным сигналам.
То есть разные животные имеют разную чувствительность, с помощью которой их тело и мозг способны воспринимать окружающую среду. Американский психолог Гибсон называет возможность действия организма в определенной среде «аффордансом» (с проникновением интернет-технологий аффорданс стал использоваться для объяснения использования цифровых технологий в медийных практиках и повседневных взаимодействиях человека). **
В соответствии с характером своего алгоритма, LLM имеют только бинарные шаблоны кодирования, могут принимать только двоичную информацию и в дальнейшем выполнять сетевые алгоритмы, присущие сложным трансформаторным структурам, которые составляют рабочую архитектуру современных LLM. В то время как нейронные спайки также способны кодировать входящие аналоговые сигналы в цифровые сигналы (т.е. двоичные сигналы), поток информации, доставляемый в LLM, является весьма абстрактным и не имеет какой-либо сильной связи с внешним миром. Текст и речь, закодированные в виде последовательности букв, просто не могут соответствовать динамической сложности природного мира, т.е. среда LLM (двоичная информация, предоставляемая ему) фундаментально отличается от информации, которая поступает в наш мозг, когда мы открываем глаза или общаемся в разговоре, и опыта, который приходит вместе с ней. Традиционный философский дискурс подчеркивает уникальность потока информации между разными видами (например, различие между человеком и летучими мышами) и феноменологические характеристики этих переживаний. Мы полагаем, что информация, полученная магистрами права, может демонстрировать более существенные различия, хотя в настоящее время нет окончательного способа количественно оценить эту разницу.
Тем не менее, в будущем вклад систем искусственного интеллекта будет неумолимо расширяться. Будущие LLM могут быть оснащены различными типами входных данных, которые могут лучше соответствовать типам сигналов, к которым сознательные агенты могут получать доступ на ежедневной основе (например, статистика из мира природы). Итак, будет ли доступная среда систем ИИ в будущем шире, чем среда обитания человека?
Отвечая на этот вопрос, мы должны признать, что человеческое подсознание и сознательный опыт определяются не только сенсорной информацией. Например, представьте себе, что, когда мы лежим в понтоне, мы все еще находимся в сознании, несмотря на отсутствие нормального сенсорного опыта. Здесь подчеркивается концепция, что среда предполагает неотъемлемую субъективную перспективу, т.е. отталкиваться от субъекта. Точно так же аффорфорность зависит от внутренней природы субъекта, в частности от его мотивации и целей. Это означает, что сознание не может быть порождено только окружающей средой (входными данными LLM). Таким образом, простая передача большого потока данных в систему ИИ не делает саму систему ИИ сознательной. **
Эта перспектива может побудить нас переосмыслить некоторые из основных допущений в науке о сознании. В частности, по мере того, как системы ИИ постепенно демонстрируют все более изощренные возможности, исследователям придется переоценить необходимость более фундаментальных процессов, связанных с личностью и агентами, предлагаемых некоторыми теориями сознания для возникновения сознания.
**"Интеграция" сознания **
В настоящее время существует множество исследований, посвященных нейронной корреляции сознания, среди которых существует множество различных теорий о нейронных цепях обработки сознания. Некоторые подчеркивают, что в основе сознания лежит плотная, тесно связанная таламо-кортикальная сеть. ** Таламо-кортикальная сеть включает корковые области, кортикально-корковые соединения и расходящиеся проекции высших ядер таламуса в корковые области. Эта специфическая структура таламо-кортикальной системы поддерживает циркуляционную и сложную обработку мыслей, которая лежит в основе сознания и сознательной интеграции (т.е. сознание едино, несмотря на то, что сознание возникает из разных областей мозга). Однако разные теории придерживаются разных взглядов на то, как достичь интеграции сознания.
Согласно глобальной теории нейронного рабочего пространства (GNW), сознание опирается на центральное рабочее пространство, состоящее из распределенной системы лобно-теменной коры. Это рабочее пространство интегрирует информацию от локальных корковых процессоров, а затем передает ее всем локальным корковым процессорам в глобальном масштабе, с глобальной доставкой, разделяющей сознательные и бессознательные процессы. Другие теории сознания утверждают, что сознательная интеграция достигается другими нейронными процессами. Например, теория нейрональной дендритной интеграции (DIT) предполагает, что сознательная интеграция происходит через явление высокочастотной синхронизации между различными областями коры, которое может включать различные функции, включая восприятие, познание или моторное планирование, в зависимости от вовлеченной области коры.
Рисунок 2: Нейронная структура интеграции сознания на основе теории дендритной интеграции нейронов (DIT) Источник: Trends in Neurosciences
На снимке: В теории DIT (рис. 2) исследователи считают, что глобальная сознательная интеграция также зависит от локальной интеграции пирамидных нейронов в пятом слое коры головного мозга, большого возбуждающего нейрона, который является центральным как в таламо-кортикальных, так и в корковых цепях. В этом типе нейронов есть две основные структуры (рис. 2, оранжевый и красный цилиндры), которые обрабатывают совершенно разные типы информации: базальная структура (красная) обрабатывает внешнюю основную информацию, а апикальная структура (оранжевая) обрабатывает информацию, генерируемую внутренне. Согласно теории ДИТ, в состоянии сознания эти две структуры связаны друг с другом, позволяя информации протекать через таламо-кортикальные и кортико-кортикальные цепи, тем самым обеспечивая общесистемную интеграцию информации и генерацию сознания. *
Важно отметить, что в архитектурах современных LLM и других систем ИИ отсутствуют черты, на которые обращают внимание эти теории: существующие LLM не имеют ни эквивалентных биструктурных пирамидных нейронов, ни централизованных таламических архитектур, ни глобальных рабочих пространств, ни множества функций систем восходящего возбуждения. Другими словами, существующим системам искусственного интеллекта не хватает функций мозга, которые, по мнению нейробиологов, лежат в основе генерации сознания. Хотя мозг млекопитающих не является единственной структурой, способной поддерживать производство сознания, данные нейробиологии свидетельствуют о том, что формирование сознания млекопитающих определяется очень специфическими структурными принципами (т.е. простыми связями между интегрированными и возбужденными нейронами). Топологически структура существующих систем ИИ предельно проста, что является одной из причин, почему мы не считаем существующие системы ИИ феноменально-сознательными.
Итак, смогут ли будущие модели ИИ, наконец, интегрировать процесс «интеграции», который многие теории сознания считают основным? В ответ на эту проблему концепция «интеграции», предложенная теорией ВНЗ, предлагает относительно простой способ ее реализации. На самом деле, некоторые недавние системы искусственного интеллекта были включены в нечто вроде глобального рабочего пространства, совместно используемого локальным процессором. Поскольку вычислительный процесс глобальной передачи может быть реализован в системе ИИ, согласно этой теории, система ИИ, использующая этот вычислительный метод, будет содержать основные компоненты латентного сознания.
Однако, как упоминалось ранее, не все теории сознания согласны с тем, что этот способ интеграции является ключом к порождению сознания. Например, интегрированная информационная теория сознания утверждает, что программные системы ИИ, реализованные на типичном современном компьютере, не могут быть сознательными, потому что современные компьютеры не имеют надлежащей архитектуры для достижения возможностей причинно-следственного мышления, необходимых для полной интеграции информации. Поэтому мы рассмотрим третью возможность, которая заключается в том, что сознание в принципе достижимо, но, возможно, ему придется выйти за пределы текущего (и, возможно, будущего) уровня вычислительной специфичности систем ИИ. **
Сознание — это сложный биологический процесс
Генерация сознания зависит не только от архитектуры системы. Например, когда мы находимся в глубоком сне или наркозе, структура таламо-кортикальной системы не меняется, но сознание исчезает. Даже в глубоком сне локальные нейронные реакции и активность гамма-пояса в основных сенсорных областях аналогичны таковым в сознательном состоянии. Это говорит о том, что сознание опирается на определенные нейронные процессы, но эти нейронные процессы различаются в сознательном и бессознательном мозге. **
Чтобы пролить свет на детальные различия между сознательной и бессознательной обработкой, давайте сначала вернемся к теории дендритной интеграции нейронов (DIT). Теория DIT содержит ряд нейробиологических нюансов, связанных с нервными процессами, которые сознательно и бессознательно обрабатываются. Теория DIT предполагает, что ключевое различие между сознательной и бессознательной обработкой заключается в интеграции двух компартментных структур пирамидных клеток (рис. 2). Как упоминалось ранее, во время сознательной обработки эти две структуры взаимодействуют друг с другом, позволяя всей таламо-кортикальной системе обрабатывать и интегрировать сложную информацию. Однако в состоянии наркоза различные анестетики приводят к функциональной развязке между двумя структурами нейронов позвонков. Другими словами, хотя эти позвоночные нейроны анатомически интактны и могут возбуждать потенциалы действия, их способность к дендритной интеграции сильно ограничена физиологически, т.е. обратная связь сверху вниз не может влиять на обработку. Исследования показали, что это дендритное соединение контролируется метаботропными рецепторами, однако эта структура часто упускается из виду в вычислительных моделях и искусственных нейронных сетях. Кроме того, исследования показали, что в этом случае высшие ядра таламуса контролируют активность этого метаботропного рецептора. Таким образом, специфические нейробиологические процессы могут быть ответственны за «включение» и «выключение» сознания в мозге. Это говорит о том, что качество опыта в мозге млекопитающих имеет сложную взаимосвязь с основными процессами, которые порождают сознание. **
Хотя эти теории достаточно убедительны, почти наверняка это знание меркнет по сравнению со сложностью нервных процессов, возникающих при полном понимании сознания. Наши нынешние объяснения сознания опираются на такие теории, как глобальное рабочее пространство, интегрированная информация, круговая обработка, дендритная интеграция и т.д., но биологические процессы, посредством которых возникает истинное сознание, могут быть гораздо более сложными, чем в настоящее время понимаются этими теориями. Вполне возможно даже, что абстрактные идеи вычислительного уровня, используемые в настоящее время для построения дискуссии об исследовании сознания, могут быть совершенно не в состоянии принять во внимание необходимые вычислительные детали, необходимые для объяснения сознания.
Другими словами, биология сложна, и наше нынешнее понимание биокомпьютеров ограничено (рис. 3), поэтому, возможно, нам не хватает правильных математических и экспериментальных инструментов для понимания сознания. **
Рисунок 2: Нейронная структура интеграции сознания на основе теории дендритной интеграции нейронов (DIT) Источник: Trends in Neurosciences
На снимке: В теории DIT (рис. 2) исследователи считают, что глобальная сознательная интеграция также зависит от локальной интеграции пирамидных нейронов в пятом слое коры головного мозга, большого возбуждающего нейрона, который является центральным как в таламо-кортикальных, так и в корковых цепях. В этом типе нейронов есть две основные структуры (рис. 2, оранжевый и красный цилиндры), которые обрабатывают совершенно разные типы информации: базальная структура (красная) обрабатывает внешнюю основную информацию, а апикальная структура (оранжевая) обрабатывает информацию, генерируемую внутренне. Согласно теории ДИТ, в состоянии сознания эти две структуры связаны друг с другом, позволяя информации протекать через таламо-кортикальные и кортико-кортикальные цепи, тем самым обеспечивая общесистемную интеграцию информации и генерацию сознания. *
Для того, чтобы лучше понять биологическую сложность, важно подчеркнуть, что описанные выше биологические процессы на клеточном и системном уровнях должны происходить в живом организме и неразделимы. Живые организмы отличаются от современных машин и алгоритмов искусственного интеллекта тем, что способны постоянно поддерживать себя на разных уровнях обработки. Кроме того, живые системы имеют многогранную историю эволюции и развития, и их существование зависит от их деятельности на нескольких организационных уровнях. Сознание неразрывно связано с организацией живых систем. Стоит, однако, отметить, что современные компьютеры не способны воплотить эту организационную сложность живых систем (т.е. взаимодействие между различными уровнями системы). Это говорит о том, что современные алгоритмы ИИ не имеют каких-либо ограничений организационного уровня и не могут работать так же эффективно, как живая система. Это означает, что до тех пор, пока ИИ основан на программном обеспечении, он может не подходить для того, чтобы быть сознательным и разумным. **
Понятие биологической сложности может быть выражено и на клеточном уровне. Биологический нейрон — это не просто абстрактная сущность, которую можно полностью описать с помощью нескольких строк кода. Биологические нейроны, напротив, имеют многоуровневую организацию и полагаются на дальнейшие каскады сложных биофизических процессов внутри нейронов. Возьмем, к примеру, «цикл Кребса», который лежит в основе клеточного дыхания и является ключевым процессом в поддержании клеточного гомеостаза. Клеточное дыхание является важнейшим биологическим процессом, который позволяет клеткам преобразовывать энергию, хранящуюся в органических молекулах, в форму энергии, которую клетки могут использовать. Однако этот процесс не может быть «сжат» в программное обеспечение, так как биофизические процессы, такие как клеточное дыхание, должны основываться на реальных физических молекулах. Конечно, это не означает, что сознание нуждается в «цикле Кребса», но скорее подчеркивает, что подобные проблемы могут быть связаны с процессом понимания сознания, т.е., возможно, сознание не может быть отделено от лежащего в его основе механизма. **
Тем не менее, мы не полностью согласны с утверждением, что сознание вообще не может быть сгенерировано разумными системами, но мы должны учитывать корреляцию между сознанием и сложной биологической организацией, стоящей за жизнью, и типы вычислений, которые отражают природу сознания, могут быть гораздо более сложными, чем предполагают наши современные теории. Провести «биопсию» сознания и извлечь его из ткани практически невозможно. Эта точка зрения противоречит многим современным теориям о сознании, которые утверждают, что сознание может возникать на абстрактном вычислительном уровне. Теперь это предположение необходимо обновить в свете современных систем ИИ: чтобы полностью понять сознание, мы не можем игнорировать межмасштабную взаимозависимость и организационную сложность, наблюдаемую в живых системах. **
Несмотря на то, что системы ИИ имитируют свои биологические аналоги на уровне сетевых вычислений, в этих системах все другие уровни биологических процессов были абстрагированы от процессов, имеющих тесную причинно-следственную связь с сознанием в мозге, поэтому существующие системы ИИ могли абстрагироваться от самого сознания. В результате, LLM и будущие системы искусственного интеллекта могут оказаться в ловушке бесконечного потока симулируемых функций сознания, но без какого-либо феноменального сознания, о котором можно было бы говорить. Если сознание действительно связано с этими другими уровнями обработки информации или с их взаимодействием между различными масштабами, то мы далеки от возможности того, чтобы машина порождала сознание.
Резюме
В этой статье мы исследуем возможность существования сознания в LLM и будущих системах искусственного интеллекта с точки зрения нейробиологии. Какими бы привлекательными ни были магистры права, они не обладают сознанием и не будут сознательными в течение более короткого периода времени в будущем.
Во-первых, мы иллюстрируем огромную разницу между средой обитания млекопитающих («малая часть» внешнего мира, которую они могут воспринимать) и крайне обедненной и ограниченной средой обитания LLM. Во-вторых, мы утверждаем, что топология LLM, хотя и очень сложная, эмпирически сильно отличается от нейробиологических деталей цепей, связанных с сознанием млекопитающих, и поэтому нет веских оснований полагать, что LLM способны генерировать феноменальное сознание (рис. Абстрагироваться от сложности биологической организации, которая присуща живым системам, но которой, очевидно, нет в системах ИИ, пока не представляется возможным. В целом, вышеупомянутые три ключевых момента делают невозможным для магистров права быть сознательными в их нынешнем виде. Они имитируют только характеристики человеческого общения на естественном языке, используемые для описания богатства сознательного опыта.
В этой статье мы надеемся, что представленные аргументы окажут положительное влияние и размышления (см. Нерешенные вопросы), а не просто будут представлять собой возражение. Во-первых, нынешние потенциальные этические проблемы, связанные с предполагаемыми способностями магистров права, являются скорее гипотетическими, чем реальными. Кроме того, мы считаем, что более глубокое понимание сходств и различий между LLM и топологиями мозга млекопитающих может способствовать прогрессу в области машинного обучения и нейробиологии. Мы также надеемся продвинуть вперед сообщество машинного обучения и нейробиологии, имитируя характеристики мозговой ткани и изучая, как простые распределенные системы обрабатывают сложные информационные потоки. По этим причинам мы с оптимизмом смотрим на то, что будущее сотрудничество между исследователями ИИ и нейробиологами может привести к более глубокому пониманию сознания.
Нерешенные последующие действия:
Оценка осведомленности в магистратуре и ИИ часто опирается на языковые тесты для выявления сознания. Можно ли оценить сознание, основываясь исключительно на языке (т.е. тексте), и существуют ли другие оценочные признаки, которые могут помочь определить, является ли искусственная система сознательной?
Нейронная основа сознания млекопитающих связана с таламо-кортикальной системой. Как можно реализовать таламо-кортикальную систему в ИИ? Какие конкретные функции и задачи принесет пользу таламо-кортикальная система?
Восходящая система возбуждения также играет важнейшую роль в формировании сознания у организмов, играет сложную и многогранную роль в формировании нейродинамики. В какой степени ИИ должен имитировать эти различные процессы, чтобы воспользоваться вычислительным преимуществом растущей системы пробуждения?
Помимо таламо-кортикальной системы, дендриты играют ключевую роль в некоторых теориях сознания, обсуждаемых в этой статье. Являются ли дендриты лишь одним из факторов, повышающих вычислительную сложность/эффективность биологических нейронных сетей, или это нечто большее?
Связана ли организационная сложность живых систем с сознанием? Живые системы состоят из различных уровней процессов обработки, которые взаимодействуют друг с другом. Можно ли объяснить организационную сложность живых систем более подробно? Нужны ли новые математические структуры для работы с такими системами, чтобы пролить больше света на биологические процессы, посредством которых возникает сознание?
Некоторые теории предполагают, что сознание и свобода воли неразрывно связаны. Чтобы понять, как сознание возникает из биологической активности, нужно ли ему сначала понять агентность?
Оригинальная ссылка
Ару, Дж., Ларкум, М.Е. и Шайн, Д.М. (2023b) «Осуществимость искусственного сознания через призму нейронауки», Тенденции в нейронауках [Preprint] . DOI:10.1016/j.tins.2023.09.009.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Поджурнал Cell критически опубликовал статью о том, что ИИ вряд ли сможет генерировать сознание в краткосрочной перспективе
Первоисточник: NextQuestion
Взаимодействуя с большими языковыми моделями (LLM), мы всегда испытываем смутное ощущение, что они на самом деле могут быть сознательными. Однако, с точки зрения нейробиологов, эту точку зрения трудно придерживаться.
В недавней статье, опубликованной в Trends in Neurosciences, поджурнале Cell, трое ученых из области компьютерных наук, биологии и нейробиологии углубились в вопрос: «Может ли искусственный интеллект генерировать сознание?».
В заключение, они согласны с тем, что магистры права не могут быть сознательными в своей нынешней форме. Как возникла такая категоричная точка зрения?
LLM и сознание
Долгое время ставился вопрос о том, какие животные обладают сознанием и какие сущности обладают сознанием, кроме животных. Недавнее появление LLM привнесло совершенно новый взгляд на эту проблему. Она показывает нам нашу способность к общению (проявление человеческого сознания) и заставляет нас переопределить и переосмыслить три понятия «понимание», «интеллект» и «сознание».
LLM — это сложные, многослойные искусственные нейронные сети с миллиардами весов связей, обученные на десятках миллиардов слов текстовых данных, включая разговоры между людьми на естественном языке. Задавая вопросы с помощью текста, пользователь погружается в увлекательный смоделированный контекст. Если вы готовы потратить время на использование этих систем, трудно не быть пораженным глубиной и качеством сети. Задайте ему вопрос, и его ответ часто будет неуловимо похож на тот, который может задать сознательный человек. Поэтому, будучи проницательным, сознательным человеком, легко заключить, что ответы, которые я получаю, генерируются человеком, который также обладает «сознанием» и способен думать, чувствовать, рассуждать и переживать. **
Основываясь на результатах таких «тестов Тьюринга», мы не можем не задаться вопросом, обладают ли LLM уже сознанием, или они скоро станут сознательными? Однако этот вопрос, в свою очередь, приведет к ряду этических дилемм, например, этично ли продолжать разработку LLM, которые раз за разом находятся на грани пробуждения «сознания»? Идея о том, что LLM обладают «сознанием», сегодня не является общепринятой в нейробиологическом сообществе, но по мере того, как возможности систем ИИ продолжают совершенствоваться, обсуждение этой идеи неизбежно возвращается на первый план. Кроме того, основные средства массовой информации также широко обсуждают этот вопрос, побуждая нейробиологов объективно интерпретировать этот вопрос с собственной профессиональной точки зрения.
Идея о том, что LLM потенциально обладают сознанием, часто подкрепляется важным аргументом в пользу того, что архитектура LLM в значительной степени вдохновлена характеристиками мозга (рис. 1), и что мозг является единственным объектом, который мы можем с уверенностью отнести к «сознательным» в данный момент. В то время как ранние искусственные нейронные сети были разработаны на основе упрощенных версий коры головного мозга, современные LLM высокотехнологичны и адаптированы для конкретных целей и больше не сохраняют глубокую гомологию с известными структурами мозга. На самом деле, многие из функций, которые делают LLM вычислительно мощными (рис. 1), имеют архитектуру, сильно отличающуюся от систем, которые, как мы считаем в настоящее время, обладают причинно-следственной силой в генерации и формировании сознания у млекопитающих. Например, многие нейробиологические теории, связанные с генерацией сознания, предполагают, что таламо-кортикальная система и система возбуждения играют центральную роль в обработке сознания, что недоступно в современных LLM.
В этот момент можно спросить, так ли важно, чтобы архитектура LLM имитировала характеристики мозга?
На наш взгляд, основная причина заключается в том, что в данный момент мы можем быть уверены только в существовании одного сознания, которое исходит из мозга, встроенного в сложное тело. Кто-то может возразить, что, строго говоря, этот аргумент можно сузить до людей, хотя многие из черт системного уровня, которые, как считается, играют важную роль в субъективном сознании, преобладают во всем биологическом спектре, вплоть до млекопитающих и даже беспозвоночных.
С учетом сказанного, давайте начнем с точного значения слова «сознание». Затем мы представим три аргумента против идеи о том, что нынешние системы ИИ обладают или скоро будут обладать сознанием в будущем:
Что такое сознание?
Сознание – сложное понятие, и его определение является дискуссионным. В контексте способности людей общаться и взаимодействовать друг с другом, способность к общению и диалогу является инстинктивным элементом, позволяющим оценить, обладает ли человек сознанием.
Языковые интерактивные беседы с магистрами права часто развивают интуитивное чувство, которое является отправной точкой для оценки того, может ли магистр права быть сознательным. Однако, несмотря на то, что магистры права отлично справляются с интерактивными беседами, это не соответствует формальному объективному критерию сознания, а является лишь предварительным свидетельством интеллекта. **
Появление LLM заставило нас переоценить, способен ли человек генерировать сознание непосредственно из вербальных взаимодействий с другими людьми. Таким образом, новая точка зрения заключается в том, что нам необходимо переформулировать критерии оценки человекоподобных способностей и человекоподобных характеристик.
Слово «сознание» часто имеет разные значения. Например, неврологи часто ссылаются на «уровень сознания», который является первой оценкой того, находится ли человек в сознании, а затем уровень или конкретное состояние сознания в более детальном виде. Психологов, с другой стороны, больше интересует содержание сознания: специфические переживания, воспоминания и мысли о внутреннем мире индивида. Кроме того, существуют различия между различными содержаниями сознания. Наш опыт может быть описан как феноменальный или эмпирический (например, когда мы видим или чувствуем запах яблока, или прикасаемся к своей руке) или в более абстрактной форме (например, как мы воображаем, представляем или манипулируем концептуальной памятью).
На вопрос о том, обладает ли система ИИ сознанием, можно ответить несколькими способами: она может сосредоточиться на некоторых значениях сознания или сосредоточиться на всех значениях сознания одновременно. Далее мы сосредоточимся в первую очередь на феноменальной осознанности и исследуем, способны ли машины феноменально воспринимать мир.
Об окружающей среде
Та часть организма, которая может быть использована в процессе восприятия окружающего мира, называется его окружением. Например, сетчатка человека реагирует на свет с длиной волны 380 нм – 740 нм, т.е. сетчатка способна воспринимать спектр от синего до красного. Без помощи внешних технологий человек не может обнаружить инфракрасный свет (>740 нм) или ультрафиолетовый свет (< 380 нм) за пределами этого диапазона длин волн. У нас также есть схожая среда с точки зрения слуха, соматосенсорных и вестибулярных чувств, а именно соответствующие слуховые домены (человеческое ухо может слышать звуки от 20 Гц до 20 000 Гц), соматосенсорные домены (люди могут различать стимулы с точностью до 1 мм от определенных частей тела) и вестибулярный домен (взаимосвязанные трехмерные структуры полукружных каналов человека обеспечивают нам внутреннее чувство равновесия). В то же время другие виды в природе способны обнаруживать сигналы в других диапазонах электромагнитного спектра. Например, пчелы могут видеть свет в ультрафиолетовом диапазоне, а змеи могут обнаруживать сигналы инфракрасного излучения в дополнение к более традиционным визуальным сигналам.
То есть разные животные имеют разную чувствительность, с помощью которой их тело и мозг способны воспринимать окружающую среду. Американский психолог Гибсон называет возможность действия организма в определенной среде «аффордансом» (с проникновением интернет-технологий аффорданс стал использоваться для объяснения использования цифровых технологий в медийных практиках и повседневных взаимодействиях человека). **
В соответствии с характером своего алгоритма, LLM имеют только бинарные шаблоны кодирования, могут принимать только двоичную информацию и в дальнейшем выполнять сетевые алгоритмы, присущие сложным трансформаторным структурам, которые составляют рабочую архитектуру современных LLM. В то время как нейронные спайки также способны кодировать входящие аналоговые сигналы в цифровые сигналы (т.е. двоичные сигналы), поток информации, доставляемый в LLM, является весьма абстрактным и не имеет какой-либо сильной связи с внешним миром. Текст и речь, закодированные в виде последовательности букв, просто не могут соответствовать динамической сложности природного мира, т.е. среда LLM (двоичная информация, предоставляемая ему) фундаментально отличается от информации, которая поступает в наш мозг, когда мы открываем глаза или общаемся в разговоре, и опыта, который приходит вместе с ней. Традиционный философский дискурс подчеркивает уникальность потока информации между разными видами (например, различие между человеком и летучими мышами) и феноменологические характеристики этих переживаний. Мы полагаем, что информация, полученная магистрами права, может демонстрировать более существенные различия, хотя в настоящее время нет окончательного способа количественно оценить эту разницу.
Тем не менее, в будущем вклад систем искусственного интеллекта будет неумолимо расширяться. Будущие LLM могут быть оснащены различными типами входных данных, которые могут лучше соответствовать типам сигналов, к которым сознательные агенты могут получать доступ на ежедневной основе (например, статистика из мира природы). Итак, будет ли доступная среда систем ИИ в будущем шире, чем среда обитания человека?
Отвечая на этот вопрос, мы должны признать, что человеческое подсознание и сознательный опыт определяются не только сенсорной информацией. Например, представьте себе, что, когда мы лежим в понтоне, мы все еще находимся в сознании, несмотря на отсутствие нормального сенсорного опыта. Здесь подчеркивается концепция, что среда предполагает неотъемлемую субъективную перспективу, т.е. отталкиваться от субъекта. Точно так же аффорфорность зависит от внутренней природы субъекта, в частности от его мотивации и целей. Это означает, что сознание не может быть порождено только окружающей средой (входными данными LLM). Таким образом, простая передача большого потока данных в систему ИИ не делает саму систему ИИ сознательной. **
Эта перспектива может побудить нас переосмыслить некоторые из основных допущений в науке о сознании. В частности, по мере того, как системы ИИ постепенно демонстрируют все более изощренные возможности, исследователям придется переоценить необходимость более фундаментальных процессов, связанных с личностью и агентами, предлагаемых некоторыми теориями сознания для возникновения сознания.
**"Интеграция" сознания **
В настоящее время существует множество исследований, посвященных нейронной корреляции сознания, среди которых существует множество различных теорий о нейронных цепях обработки сознания. Некоторые подчеркивают, что в основе сознания лежит плотная, тесно связанная таламо-кортикальная сеть. ** Таламо-кортикальная сеть включает корковые области, кортикально-корковые соединения и расходящиеся проекции высших ядер таламуса в корковые области. Эта специфическая структура таламо-кортикальной системы поддерживает циркуляционную и сложную обработку мыслей, которая лежит в основе сознания и сознательной интеграции (т.е. сознание едино, несмотря на то, что сознание возникает из разных областей мозга). Однако разные теории придерживаются разных взглядов на то, как достичь интеграции сознания.
Согласно глобальной теории нейронного рабочего пространства (GNW), сознание опирается на центральное рабочее пространство, состоящее из распределенной системы лобно-теменной коры. Это рабочее пространство интегрирует информацию от локальных корковых процессоров, а затем передает ее всем локальным корковым процессорам в глобальном масштабе, с глобальной доставкой, разделяющей сознательные и бессознательные процессы. Другие теории сознания утверждают, что сознательная интеграция достигается другими нейронными процессами. Например, теория нейрональной дендритной интеграции (DIT) предполагает, что сознательная интеграция происходит через явление высокочастотной синхронизации между различными областями коры, которое может включать различные функции, включая восприятие, познание или моторное планирование, в зависимости от вовлеченной области коры.
Важно отметить, что в архитектурах современных LLM и других систем ИИ отсутствуют черты, на которые обращают внимание эти теории: существующие LLM не имеют ни эквивалентных биструктурных пирамидных нейронов, ни централизованных таламических архитектур, ни глобальных рабочих пространств, ни множества функций систем восходящего возбуждения. Другими словами, существующим системам искусственного интеллекта не хватает функций мозга, которые, по мнению нейробиологов, лежат в основе генерации сознания. Хотя мозг млекопитающих не является единственной структурой, способной поддерживать производство сознания, данные нейробиологии свидетельствуют о том, что формирование сознания млекопитающих определяется очень специфическими структурными принципами (т.е. простыми связями между интегрированными и возбужденными нейронами). Топологически структура существующих систем ИИ предельно проста, что является одной из причин, почему мы не считаем существующие системы ИИ феноменально-сознательными.
Итак, смогут ли будущие модели ИИ, наконец, интегрировать процесс «интеграции», который многие теории сознания считают основным? В ответ на эту проблему концепция «интеграции», предложенная теорией ВНЗ, предлагает относительно простой способ ее реализации. На самом деле, некоторые недавние системы искусственного интеллекта были включены в нечто вроде глобального рабочего пространства, совместно используемого локальным процессором. Поскольку вычислительный процесс глобальной передачи может быть реализован в системе ИИ, согласно этой теории, система ИИ, использующая этот вычислительный метод, будет содержать основные компоненты латентного сознания.
Однако, как упоминалось ранее, не все теории сознания согласны с тем, что этот способ интеграции является ключом к порождению сознания. Например, интегрированная информационная теория сознания утверждает, что программные системы ИИ, реализованные на типичном современном компьютере, не могут быть сознательными, потому что современные компьютеры не имеют надлежащей архитектуры для достижения возможностей причинно-следственного мышления, необходимых для полной интеграции информации. Поэтому мы рассмотрим третью возможность, которая заключается в том, что сознание в принципе достижимо, но, возможно, ему придется выйти за пределы текущего (и, возможно, будущего) уровня вычислительной специфичности систем ИИ. **
Сознание — это сложный биологический процесс
Генерация сознания зависит не только от архитектуры системы. Например, когда мы находимся в глубоком сне или наркозе, структура таламо-кортикальной системы не меняется, но сознание исчезает. Даже в глубоком сне локальные нейронные реакции и активность гамма-пояса в основных сенсорных областях аналогичны таковым в сознательном состоянии. Это говорит о том, что сознание опирается на определенные нейронные процессы, но эти нейронные процессы различаются в сознательном и бессознательном мозге. **
Чтобы пролить свет на детальные различия между сознательной и бессознательной обработкой, давайте сначала вернемся к теории дендритной интеграции нейронов (DIT). Теория DIT содержит ряд нейробиологических нюансов, связанных с нервными процессами, которые сознательно и бессознательно обрабатываются. Теория DIT предполагает, что ключевое различие между сознательной и бессознательной обработкой заключается в интеграции двух компартментных структур пирамидных клеток (рис. 2). Как упоминалось ранее, во время сознательной обработки эти две структуры взаимодействуют друг с другом, позволяя всей таламо-кортикальной системе обрабатывать и интегрировать сложную информацию. Однако в состоянии наркоза различные анестетики приводят к функциональной развязке между двумя структурами нейронов позвонков. Другими словами, хотя эти позвоночные нейроны анатомически интактны и могут возбуждать потенциалы действия, их способность к дендритной интеграции сильно ограничена физиологически, т.е. обратная связь сверху вниз не может влиять на обработку. Исследования показали, что это дендритное соединение контролируется метаботропными рецепторами, однако эта структура часто упускается из виду в вычислительных моделях и искусственных нейронных сетях. Кроме того, исследования показали, что в этом случае высшие ядра таламуса контролируют активность этого метаботропного рецептора. Таким образом, специфические нейробиологические процессы могут быть ответственны за «включение» и «выключение» сознания в мозге. Это говорит о том, что качество опыта в мозге млекопитающих имеет сложную взаимосвязь с основными процессами, которые порождают сознание. **
Хотя эти теории достаточно убедительны, почти наверняка это знание меркнет по сравнению со сложностью нервных процессов, возникающих при полном понимании сознания. Наши нынешние объяснения сознания опираются на такие теории, как глобальное рабочее пространство, интегрированная информация, круговая обработка, дендритная интеграция и т.д., но биологические процессы, посредством которых возникает истинное сознание, могут быть гораздо более сложными, чем в настоящее время понимаются этими теориями. Вполне возможно даже, что абстрактные идеи вычислительного уровня, используемые в настоящее время для построения дискуссии об исследовании сознания, могут быть совершенно не в состоянии принять во внимание необходимые вычислительные детали, необходимые для объяснения сознания.
Другими словами, биология сложна, и наше нынешнее понимание биокомпьютеров ограничено (рис. 3), поэтому, возможно, нам не хватает правильных математических и экспериментальных инструментов для понимания сознания. **
Для того, чтобы лучше понять биологическую сложность, важно подчеркнуть, что описанные выше биологические процессы на клеточном и системном уровнях должны происходить в живом организме и неразделимы. Живые организмы отличаются от современных машин и алгоритмов искусственного интеллекта тем, что способны постоянно поддерживать себя на разных уровнях обработки. Кроме того, живые системы имеют многогранную историю эволюции и развития, и их существование зависит от их деятельности на нескольких организационных уровнях. Сознание неразрывно связано с организацией живых систем. Стоит, однако, отметить, что современные компьютеры не способны воплотить эту организационную сложность живых систем (т.е. взаимодействие между различными уровнями системы). Это говорит о том, что современные алгоритмы ИИ не имеют каких-либо ограничений организационного уровня и не могут работать так же эффективно, как живая система. Это означает, что до тех пор, пока ИИ основан на программном обеспечении, он может не подходить для того, чтобы быть сознательным и разумным. **
Понятие биологической сложности может быть выражено и на клеточном уровне. Биологический нейрон — это не просто абстрактная сущность, которую можно полностью описать с помощью нескольких строк кода. Биологические нейроны, напротив, имеют многоуровневую организацию и полагаются на дальнейшие каскады сложных биофизических процессов внутри нейронов. Возьмем, к примеру, «цикл Кребса», который лежит в основе клеточного дыхания и является ключевым процессом в поддержании клеточного гомеостаза. Клеточное дыхание является важнейшим биологическим процессом, который позволяет клеткам преобразовывать энергию, хранящуюся в органических молекулах, в форму энергии, которую клетки могут использовать. Однако этот процесс не может быть «сжат» в программное обеспечение, так как биофизические процессы, такие как клеточное дыхание, должны основываться на реальных физических молекулах. Конечно, это не означает, что сознание нуждается в «цикле Кребса», но скорее подчеркивает, что подобные проблемы могут быть связаны с процессом понимания сознания, т.е., возможно, сознание не может быть отделено от лежащего в его основе механизма. **
Тем не менее, мы не полностью согласны с утверждением, что сознание вообще не может быть сгенерировано разумными системами, но мы должны учитывать корреляцию между сознанием и сложной биологической организацией, стоящей за жизнью, и типы вычислений, которые отражают природу сознания, могут быть гораздо более сложными, чем предполагают наши современные теории. Провести «биопсию» сознания и извлечь его из ткани практически невозможно. Эта точка зрения противоречит многим современным теориям о сознании, которые утверждают, что сознание может возникать на абстрактном вычислительном уровне. Теперь это предположение необходимо обновить в свете современных систем ИИ: чтобы полностью понять сознание, мы не можем игнорировать межмасштабную взаимозависимость и организационную сложность, наблюдаемую в живых системах. **
Несмотря на то, что системы ИИ имитируют свои биологические аналоги на уровне сетевых вычислений, в этих системах все другие уровни биологических процессов были абстрагированы от процессов, имеющих тесную причинно-следственную связь с сознанием в мозге, поэтому существующие системы ИИ могли абстрагироваться от самого сознания. В результате, LLM и будущие системы искусственного интеллекта могут оказаться в ловушке бесконечного потока симулируемых функций сознания, но без какого-либо феноменального сознания, о котором можно было бы говорить. Если сознание действительно связано с этими другими уровнями обработки информации или с их взаимодействием между различными масштабами, то мы далеки от возможности того, чтобы машина порождала сознание.
Резюме
В этой статье мы исследуем возможность существования сознания в LLM и будущих системах искусственного интеллекта с точки зрения нейробиологии. Какими бы привлекательными ни были магистры права, они не обладают сознанием и не будут сознательными в течение более короткого периода времени в будущем.
Во-первых, мы иллюстрируем огромную разницу между средой обитания млекопитающих («малая часть» внешнего мира, которую они могут воспринимать) и крайне обедненной и ограниченной средой обитания LLM. Во-вторых, мы утверждаем, что топология LLM, хотя и очень сложная, эмпирически сильно отличается от нейробиологических деталей цепей, связанных с сознанием млекопитающих, и поэтому нет веских оснований полагать, что LLM способны генерировать феноменальное сознание (рис. Абстрагироваться от сложности биологической организации, которая присуща живым системам, но которой, очевидно, нет в системах ИИ, пока не представляется возможным. В целом, вышеупомянутые три ключевых момента делают невозможным для магистров права быть сознательными в их нынешнем виде. Они имитируют только характеристики человеческого общения на естественном языке, используемые для описания богатства сознательного опыта.
В этой статье мы надеемся, что представленные аргументы окажут положительное влияние и размышления (см. Нерешенные вопросы), а не просто будут представлять собой возражение. Во-первых, нынешние потенциальные этические проблемы, связанные с предполагаемыми способностями магистров права, являются скорее гипотетическими, чем реальными. Кроме того, мы считаем, что более глубокое понимание сходств и различий между LLM и топологиями мозга млекопитающих может способствовать прогрессу в области машинного обучения и нейробиологии. Мы также надеемся продвинуть вперед сообщество машинного обучения и нейробиологии, имитируя характеристики мозговой ткани и изучая, как простые распределенные системы обрабатывают сложные информационные потоки. По этим причинам мы с оптимизмом смотрим на то, что будущее сотрудничество между исследователями ИИ и нейробиологами может привести к более глубокому пониманию сознания.
Нерешенные последующие действия:
Оригинальная ссылка