Зеленый код — TurinTech: оптимизация кода для устойчивого ИИ

Зеленый код - TurinTech: оптимизация кода для устойчивого ИИ

Это гостевой пост для Computer Weekly Developer Network, написанный доктор Лесли Кантангенеральный директор и соучредитель TurinTech.

TurinTech обещает помочь разработчикам программных приложений раскрыть весь потенциал своего кода и данных с помощью генеративного искусственного интеллекта. Фирма заявляет, что он меняет структуру построения качественного кода и моделей машинного обучения (ML), поднимая бизнес до максимальной производительности.

Говоря о том, что искусственный интеллект стал главной темой заголовков новостей по множеству причин, команда TurinTech напоминает нам, что он обеспечивает преобразующие социальные достижения, но при этом страдает от предвзятости и проблем с авторским правом.

Что касается самих моделей, Кантан считает, что, хотя мы наблюдаем появление на рынке генеративного искусственного интеллекта и автоматизации (с такими продуктами, как ChatGPT и Midjourney), и эти продукты были очень заметны, эффекты их роста остались незаметными. вне поля зрения: чего мы не видим, так это огромного количества вычислительные ресурсы, которые пожирает этот конкурентный рынок.

Кантан пишет полностью следующее…

Одна вещь, которая по большей части остается в стороне от заголовков, но остается неотъемлемой частью всех этих разработок, — это эффективность кода ИИ. Эта эффективность имеет решающее значение не только для эффективности работы ИИ, но и для его экологичности.

Международное энергетическое агентство имеет сообщил что всплеск приложений искусственного интеллекта может удвоить глобальное потребление электроэнергии в центрах обработки данных к 2026 году, что эквивалентно тому, сколько сегодня потребляет вся Япония. Хотя мы используем ИИ и LLM для решения насущных проблем, какие шаги могут предпринять компании для повышения энергоэффективности и сокращения выбросов углекислого газа от ИИ?

Истинная цена неэффективного кода

Несмотря на экономические трудности, устойчиво высокие цены на энергоносители и приоритеты ESG, компании часто могут упускать из виду важность оптимизации своего кода искусственного интеллекта, стремясь оптимизировать операции и сократить расходы. Это может означать, что неэффективный код возникает из-за отсутствия приоритета или осведомленности.

Работая в финансовой отрасли, я воочию убедился, насколько трудоемким и ресурсоемким является ручной процесс разработки и оптимизации эффективного кода. Он включает в себя итеративную доработку и тестирование кода для достижения оптимальной производительности — процесс, который может занять несколько дней даже для опытных инженеров. Эта проблема усугубляется с большими базами кода, где отсутствие комплексного обзора препятствует эффективной оптимизации.

Хотя нет простой оценки цен, затраты на развертывание базовой системы искусственного интеллекта могут достигать 50 000 долларов США, в основном за счет аппаратного обеспечения, программного обеспечения и данных. Но не только развернутые системы искусственного интеллекта искажают баланс: на каждый опубликованный успех в области эволюции искусственного интеллекта приходится множество неопубликованных неудач в испытаниях и тестировании.

Каждый неудачный тест и процесс обучения влекут за собой последующие экологические издержки для планеты. Обучение OpenAI GPT-3 потреблено 1287 МВтч, что приводит к выбросам более 550 тонн эквивалента углекислого газа. Это сравнимо с тем, как один человек совершает 550 поездок туда и обратно между Нью-Йорком и Сан-Франциско.

Более того, неэффективный код серьезно влияет как на прибыльность, так и на качество обслуживания клиентов. Поскольку программное обеспечение на основе искусственного интеллекта в настоящее время несет расходы на облако, составляющие до 80% доходов, оптимизация кода имеет решающее значение для финансового благополучия. Эта неэффективность ставит под угрозу прибыль и вредит пользовательскому опыту, особенно там, где скорость жизненно важна, например, в торговле и автономном вождении. Потребительские приложения также страдают, влияя на удовлетворенность и лояльность.

Рост LLM

А отчет опубликованный в прошлом месяце Центром по управлению искусственным интеллектом, показал, что «за последние тринадцать лет объем вычислений, используемых для обучения ведущих систем искусственного интеллекта, увеличился в 350 миллионов раз» — и удваивается каждые шесть месяцев. Несмотря на то, что растущие вычислительные мощности открывают впечатляющие возможности искусственного интеллекта, этот быстрый рост имеет одновременный недостаток в виде огромных затрат, как финансовых, так и экологических.

Подсчитано, что за работу ChatGPT взимается невероятная сумма в 700 000 долларов в день – крайне неустойчивая модель – и отправка всего лишь одного запроса GPT будет потреблять в 15 раз больше энергии, чем поисковый запрос Google. Например, если мы интегрируем LLM в поисковые системы, это может привести к пятикратному увеличению вычислительной мощности и увеличению выбросов углекислого газа. Эти цифры подчеркивают острую необходимость в энергоэффективном кодировании, особенно в свете стремительного развития эпохи генеративного искусственного интеллекта. Проблема в том, что модели растут намного быстрее, чем их аппаратные возможности, и игнорирование неэффективного кода усугубляет этот несбалансированный рост. Однако когда дело доходит до принятия на себя ответственности и решения этой неустойчивой ситуации, неясно, сколько усилий крупные игроки вкладывают в решение этой проблемы за кулисами.

Тройка крупнейших компаний мира облачных технологий — AWS, Azure и GCP — постепенно адаптируется к ситуации и предлагает оптимизированные услуги вычислений и памяти. Тем не менее, по сравнению с резким ростом числа центров обработки данных и центров виртуальных машин для запуска крупных приложений искусственного интеллекта, эти предложения не представляют собой достаточно устойчивой альтернативы. Более мелким игрокам, стремящимся интегрировать и запускать приложения искусственного интеллекта, необходимо найти альтернативные способы сделать свои модели максимально эффективными.

Оптимизация кода способствует устойчивости

Пренебрегать эффективностью кода — это все равно, что загружать фургоны посылками наполовину; он обеспечивает меньшую производительность, но потребляет больше энергии и производит больше выбросов углекислого газа.

Оптимизация кода обеспечивает работу кода с максимальной производительностью на целевом оборудовании. Речь идет не только о том, чтобы заставить код работать; речь идет о том, чтобы код работал эффективно, уменьшая задержку и улучшая общее взаимодействие с пользователем.

Новейшие платформы оптимизации кода используют передовые методы оптимизации и предварительно обученные LLM для автоматического сканирования всей базы кода и выявления строк неэффективного кода. Затем они рекомендуют и сравнивают оптимальные изменения кода для повышения производительности и позволяют разработчикам сравнивать улучшения, внесенные с исходным кодом. Это ускоряет время выполнения приложений и значительно снижает использование вычислительных ресурсов и затраты. Это код, выполняющий те же задачи, только с гораздо большей эффективностью.

Кантан: Оптимизация эффективного кода включает в себя итеративную доработку и тестирование для достижения оптимальной производительности.

Оптимизация кода для повышения производительности модели может привести к снижению потребления памяти и энергии в среднем на 46 % и обеспечить экономию почти 2 миллионов долларов в год на производстве и развертывании моделей искусственного интеллекта. Важно отметить, что это потенциально позволит сократить выбросы CO2 на 256 кг в год, а также гораздо быстрее достичь целей устойчивого развития.

Оптимизация кода на практике

Технологический и финансовый секторы — это те два сектора, которые получат наибольшую выгоду от оптимизации кода, поскольку происходит непрерывная интеграция.

Центры обработки данных находятся на переднем крае проблемы устойчивости ИИ, и оптимизацию кода часто упускают из виду как золотой билет к снижению энергопотребления. Но эффект от оптимизации кода компаниями может привести к значительной экономии выбросов углекислого газа: это снижает вычислительную нагрузку на серверы и оптимизирует обработку, хранение и запуск программного обеспечения. Типичная мощность сервера составляет около 1800 кВтч на сервер в год. Приняв за эталон снижение энергопотребления на 46%, центры обработки данных могли бы сократить выбросы с 668 CO-экв в кг/сервер/год до 360 CO2-экв в кг/сервер/год.

В мире финансов, от повседневных банковских транзакций и огромных объемов данных, передаваемых между системами через API, до высокочастотной торговли, затраты энергии на поддержание производительности программного обеспечения огромны. Приняв методы оптимизации кода, финансовые компании могут, например, скорректировать целевую норму доходности торговой модели, чтобы максимизировать прибыльность, принимая во внимание такие факторы, как скорость прогнозирования модели, потребление электроэнергии и выбросы углекислого газа.

Золотой билет для устойчивого ИИ

Для компаний, использующих или интегрирующих ИИ, все теперь сосредоточено на определении объема используемой вычислительной мощности и, следовательно, ее стоимости и энергопотребления. Многие компании полагаются на модели с открытым исходным кодом, поэтому на крупных провайдерах лежит большая ответственность предлагать больше услуг по оптимизации кода. Однако у компаний есть эффективные способы повысить эффективность ИИ, используя инструменты оптимизации кода для улучшения моделирования производительности и приведения ее в соответствие с зелеными метриками.

Встраивая оптимизацию кода в свои процессы, они оказывают немедленный эффект на бизнес. Эффективный ИИ позволяет им быстрее делать точные прогнозы, быстрее анализировать данные и, что наиболее важно, сокращать затраты и выбросы. А если вы сможете оптимизировать свой код, чтобы он работал быстрее, вы сможете запустить свой продукт в производство гораздо быстрее.

Индустрия искусственного интеллекта нуждается в широкомасштабных, целостных стратегиях, чтобы гарантировать, что она вносит положительный вклад в устойчивое развитие и не делает двух шагов назад для достижения каждой выгоды. Зеленая энергетика, практическая политика и аппаратные преобразования имеют важное значение. Сосредоточение внимания на оптимизации кода может стать золотым билетом для немедленного предоставления устойчивых решений для ИИ. И наша планета не может позволить себе искать другие варианты.

TurinTech пишет в Твиттере на @turintechai

Поделиться в соцсетях