Ученые в Китае разработали крошечный модульный чип, который питается от света, а не от электричества, и они хотят использовать его для обучения и запуска будущей модели общего искусственного интеллекта (AGI).
Новый чиплет, получивший название «Taichi», представляет собой небольшую часть более широкой мозаики, состоящей из множества отдельных чиплетов (включая модули Taichi), которые вместе могут образовывать сложную и мощную вычислительную систему. При достаточном масштабировании это будет достаточно мощно, чтобы обучать и использовать AGI в будущем, утверждают ученые в своей статье, опубликованной 11 апреля в журнале. Наука.
AGI — это гипотетическая продвинутая форма искусственного интеллекта (ИИ), которая теоретически будет такой же умной, как и люди, с точки зрения способностей когнитивного мышления. AGI может применяться во многих дисциплинах, тогда как сегодняшние системы искусственного интеллекта могут применяться лишь в очень узком смысле.
Некоторые эксперты считают, что такие системы появятся через много лет, а узким местом в вычислительной мощности является ключевой блокирующий фактор, в то время как другие полагают, что мы создадим агент AGI уже в 2027 году.
В последние годы ученые начали осознавать ограничения традиционных электронных компонентов, особенно с учетом роста искусственного интеллекта и огромного количества энергии, необходимой для обслуживания этих все более требовательных систем.
Связанный: Компьютерный чип с легким питанием может обучать ИИ гораздо быстрее, чем компоненты, работающие от электричества.
Графические процессоры (GPU) стали ключевыми компонентами в обучении систем искусственного интеллекта, поскольку они лучше выполняют параллельные вычисления, чем центральные процессоры (ЦП). Но требуемый уровень энергопотребления становится неустойчивым по мере того, как системы становятся больше, утверждают ученые.
Компоненты на основе света могут стать одним из способов преодолеть ограничения традиционной электроники, включая проблемы энергоэффективности.
В поисках света для создания сверхчеловеческого ИИ
Ранее учёные представили проект новый тип фотонного микрочипа в феврале, который использует фотоны или частицы света вместо электронов для работы транзисторов — крошечных электрических переключателей, которые включаются или выключаются при подаче напряжения. Вообще говоря, чем больше транзисторов имеет чип, тем больше у него вычислительной мощности и тем больше энергии ему требуется для работы. Чипы на основе света гораздо менее энергоемки и могут выполнять вычисления намного быстрее, чем традиционные чипы, поскольку они могут выполнять вычисления параллельно.
Современные архитектуры фотонных чипов для моделей ИИ состоят из сотен или тысяч параметров или обучающих переменных. Это делает их достаточно мощными для решения базовых задач, таких как распознавание образов, но большие языковые модели (LLM), такие как ChatGPT, обучаются с использованием миллиардов или даже триллионов параметров.
Агенту AGI, вероятно, потребуется на много порядков больше — как часть более широкой сети архитектур ИИ. Сегодня чертежей построения системы AGI не существует.
В новом исследовании ученые разработали Taichi так, чтобы он работал так же, как и другие легкие чипы, но его можно масштабировать гораздо лучше, чем конкурирующие разработки, говорится в их статье. Это связано с тем, что он сочетает в себе несколько преимуществ существующих фотонных чипов, в том числе «оптическую дифракцию и интерференцию», которые представляют собой способы управления светом в компоненте.
Чтобы протестировать конструкцию, исследователи собрали вместе несколько чиплетов Taichi и сравнили их архитектуру с другими микросхемами на основе света в ключевых областях.
Их архитектура достигла масштаба сети в 13,96 миллиона искусственных нейронов — по сравнению с 1,47 миллиона в следующем по величине конкурирующем проекте — с показателем энергоэффективности 160,82 триллиона операций на ватт (ТОПС/Вт). Следующий лучший результат, который они выделили в своей статье, был получен исследование опубликовано в 2022 году, в котором фотонный чип достиг 2,9 TOPS/Вт. Многие традиционные нейронные процессоры (NPU) и другие микросхемы достигают значительно ниже 10 ТОПС/Вт.
Исследователи также заявили, что их архитектура на основе Taichi в два раза мощнее, чем другие фотонные системы, но они не ссылались на это напрямую. Тем временем в тестах они использовали распределенную сеть Taichi для выполнения задач, включая категоризацию и классификацию изображений, а также генерацию контента изображений, в качестве доказательства концепции, а не для оценки производительности.
«Тайчи указывает на большой потенциал встроенных фотонных вычислений для обработки множества сложных задач с помощью больших сетевых моделей, что позволяет реализовать оптические вычисления в реальной жизни», — сказали ученые. «Мы ожидаем, что Taichi ускорит разработку более мощных оптических решений, которые станут важной поддержкой базовой модели и новой эры искусственного интеллекта».