Балансирование данных обучения и человеческих знаний, чтобы ИИ действовал больше как учёный

Балансирование данных обучения и человеческих знаний, чтобы ИИ действовал больше как учёный
ай

Кредит: CC0 Public Domain

Когда вы учите ребенка решать головоломки, вы можете либо позволить ему разобраться в этом методом проб и ошибок, либо дать ему несколько основных правил и советов. Аналогичным образом, включение правил и советов в обучение ИИ, таких как законы физики, может сделать его более эффективным и более отражающим реальный мир. Однако помочь ИИ оценить ценность различных правил может оказаться непростой задачей.

Исследователи сообщают о 8 марта в журнале Нексус что они разработали структуру для оценки относительной ценности правил и данных в «информированных моделях машинного обучения», которые включают в себя и то, и другое. Они показали, что таким образом они могут помочь ИИ учесть основные законы реального мира и лучше ориентироваться в научных проблемах, таких как решение сложных математических задач и оптимизация экспериментальных условий в химических экспериментах.

«Внедрение человеческих знаний в модели ИИ потенциально может повысить их эффективность и способность делать выводы, но вопрос в том, как сбалансировать влияние данных и знаний», — говорит первый автор Хао Сюй из Пекинского университета. «Наша структура может быть использована для оценки различных знаний и правил для повышения прогностических возможностей моделей глубокого обучения».

Генеративные модели искусственного интеллекта, такие как ChatGPT и Sora, основаны исключительно на данных: моделям предоставляются обучающие данные, и они обучаются методом проб и ошибок. Однако, имея только данные для работы, эти системы не имеют возможности изучать физические законы, такие как гравитация или гидродинамика, и им также трудно работать в ситуациях, которые отличаются от их обучающих данных.

Альтернативный подход — это информированное машинное обучение, при котором исследователи предоставляют модели некоторые базовые правила, помогающие управлять процессом обучения, но мало что известно об относительной важности правил и данных для обеспечения точности модели.

«Мы пытаемся научить модели ИИ законам физики, чтобы они могли лучше отражать реальный мир, что сделало бы их более полезными в науке и технике», — говорит старший автор Юньтянь Чен из Восточного технологического института в Нинбо.

Чтобы повысить производительность информированного машинного обучения, команда разработала структуру для расчета вклада отдельного правила в точность прогнозирования данной модели. Исследователи также изучили взаимодействие между различными правилами, поскольку большинство информированных моделей машинного обучения включают в себя несколько правил, а слишком большое количество правил может привести к сбою моделей.

Это позволило им оптимизировать модели, регулируя относительное влияние различных правил и полностью отфильтровывать избыточные или мешающие правила. Они также определили некоторые правила, которые работали синергетически, и другие правила, которые полностью зависели от присутствия других правил.

«Мы обнаружили, что правила имеют разные типы взаимосвязей, и мы используем эти взаимосвязи, чтобы ускорить обучение модели и повысить точность», — говорит Чен.

Исследователи говорят, что их структура имеет широкое практическое применение в инженерии, физике и химии. В статье они продемонстрировали потенциал метода, используя его для оптимизации моделей машинного обучения для решения многомерных уравнений и прогнозирования результатов экспериментов по тонкослойной хроматографии и тем самым оптимизации будущих условий экспериментальной химии.

Далее исследователи планируют превратить свою структуру в плагин, который смогут использовать разработчики ИИ. В конечном счете, они также хотят обучить свои модели так, чтобы они могли извлекать знания и правила непосредственно из данных, а не использовать правила, выбранные исследователями-людьми.

«Мы хотим сделать это замкнутым циклом, превратив модель в настоящего ученого по искусственному интеллекту», — говорит Чен. «Мы работаем над разработкой модели, которая сможет напрямую извлекать знания из данных, а затем использовать эти знания для создания правил и самосовершенствования».

Больше информации:
Ценность предварительных знаний для улучшения глубокого обучения, Нексус (2024). DOI: 10.1016/j.ynexs.2024.100003. www.cell.com/nexus/fulltext/S2950-1601(24)00001-9

Цитирование: Балансирование данных обучения и человеческих знаний, чтобы ИИ действовал больше как учёный (8 марта 2024 г.), получено 9 марта 2024 г. с https://techxplore.com/news/2024-03-human-knowledge-ai-scientist.html.

Этот документ защищен авторским правом. За исключением любых добросовестных сделок в целях частного изучения или исследования, никакая часть не может быть воспроизведена без письменного разрешения. Содержимое предоставлено исключительно в информационных целях.

Поделиться в соцсетях