Получение динамической информации из статических снимков

Получение динамической информации из статических снимков
Получение динамической информации из статических снимков

Член междисциплинарной команды Чикагского университета, разрабатывающей новый метод использования статических данных секвенирования одноклеточной РНК для изучения того, как клетки и гены изменяются с течением времени. Слева направо: аспирантка биофизики Ханна Хиеромнимон, аспирант Притцкеровской школы молекулярной инженерии Джоуи Федерико, аспирант компьютерных наук Райан Робинетт, ассистент PME. Профессор Саманта Ризенфельд, аспирантка по химии и первый автор статьи Ченг Франк Гао, аспирант по химии Джозеф Сифакис и аспирантка по биофизике Хоуп Андерсон. Фото: Лоренцо Ореккья.

Представьте себе, что вы можете предсказать точный порядок финиша в Кентукки Дерби по фотографии, сделанной через 10 секунд после начала гонки.


Эта проблема меркнет по сравнению с тем, с чем сталкиваются исследователи при использовании секвенирования одноклеточной РНК (scRNA-seq) для изучения того, как развиваются эмбрионы, дифференцируются клетки, формируются раковые клетки и реагирует иммунная система.

В статье, опубликованной сегодня в Труды Национальной академии наукИсследователи из Притцкеровской школы молекулярной инженерии и химического факультета Калифорнийского университета в Чикаго создали TopicVelo, мощный новый метод использования статических снимков scRNA-seq для изучения того, как клетки и гены изменяются с течением времени.

Команда применила междисциплинарный совместный подход, включив концепции классического машинного обучения, вычислительной биологии и химии.

«Что касается машинного обучения без учителя, мы используем очень простую, устоявшуюся идею. А что касается модели транскрипции, которую мы используем, это тоже очень простая старая идея. Но когда вы соединяете их вместе, они делают нечто более мощное. чем вы могли ожидать», — сказала доцент кафедры молекулярной инженерии и медицины PME Саманта Ризенфельд, которая написала статью вместе с профессором химического факультета Суриянараянаном Вайкунтанатаном и их совместным студентом, доктором химии Чикагского университета. кандидат Чэн Франк Гао.

Проблема с псевдовременем

Исследователи используют scRNA-seq для получения эффективных и подробных измерений, но по своей природе статичных.

«Мы разработали TopicVelo, чтобы делать выводы о переходах клеточных состояний на основе данных scRNA-seq», — сказал Ризенфельд. «Трудно сделать это на основе таких данных, потому что секРНК-секвенирование разрушительно. Когда вы измеряете клетку таким образом, вы разрушаете клетку».

Это оставляет исследователям снимок момента, когда клетка была измерена/уничтожена. Хотя scRNA-seq дает наилучшую доступную картину всего транскриптома, однако информация, которая нужна многим исследователям, заключается в том, как клетки переходят через некоторое время. Им необходимо знать, как клетка становится раковой или как ведет себя определенная генная программа во время иммунного ответа.

Чтобы выяснить динамические процессы на основе статического снимка, исследователи традиционно используют так называемое «псевдовремя». Невозможно наблюдать за изменением и ростом отдельной клетки или гена на неподвижном изображении, но на этом изображении также запечатлены другие клетки и гены того же типа, которые могут находиться немного дальше в том же процессе. Если ученые правильно соединят все точки, они смогут получить четкое представление о том, как этот процесс будет выглядеть с течением времени.

Соединить эти точки — сложная догадка, основанная на предположении, что похожие на вид клетки просто находятся в разных точках одного и того же пути. Биология гораздо сложнее: здесь есть фальстарты, остановки, всплески и множество химических сил, воздействующих на каждый ген.

Вместо традиционных подходов псевдовремени, которые рассматривают сходство экспрессии транскрипционных профилей клеток, подходы скорости РНК рассматривают динамику транскрипции, сплайсинга и деградации мРНК внутри этих клеток.

Это многообещающая, но ранняя технология.

«Постоянный разрыв между обещаниями и реальностью скорости РНК во многом ограничивает ее применение», — пишут авторы в статье.

Чтобы восполнить этот пробел, TopicVelo откладывает детерминистические модели, прибегая к гораздо более сложной стохастической модели, отражающей неизбежную случайность биологии, и извлекая из нее информацию.

«Клетки, если о них подумать, по своей сути случайны», — сказал Гао, первый автор статьи. «У вас могут быть близнецы или генетически идентичные клетки, которые вырастут очень разными. TopicVelo вводит использование стохастической модели. Мы можем лучше понять основную биофизику процессов транскрипции, которые важны для транскрипции мРНК».

Машинное обучение показывает путь

Команда также поняла, что другое предположение ограничивает стандартную скорость РНК. «Большинство методов предполагают, что все клетки в основном экспрессируют одну и ту же большую генную программу, но вы можете себе представить, что клетки должны выполнять разные виды процессов одновременно, в разной степени», — сказал Ризенфельд. Распутывание этих процессов является непростой задачей.

Вероятностное тематическое моделирование — инструмент машинного обучения, традиционно используемый для определения тем из письменных документов — предоставило команде Чикагского университета стратегию. TopicVelo группирует данные scRNA-seq не по типам клеток или генов, а по процессам, в которых участвуют эти клетки и гены. Эти процессы выводятся из данных, а не навязываются внешними знаниями.

«Если вы посмотрите на научный журнал, то увидите, что он организован по таким темам, как «физика», «химия», «астрофизика» и тому подобное», — сказал Гао. «Мы применили этот принцип организации к данным секвенирования одноклеточной РНК. Итак, теперь мы можем систематизировать наши данные по таким темам, как «синтез рибосом», «дифференцировка», «иммунный ответ» и «клеточный цикл». подходят стохастические модели транскрипции, специфичные для каждого процесса».

После того как TopicVelo распутывает этот набор процессов и организует их по темам, он снова применяет веса тем к клеткам, чтобы учесть, какой процент транскрипционного профиля каждой клетки в какой деятельности задействован.

По словам Ризенфельда, «этот подход помогает нам взглянуть на динамику различных процессов и понять их важность в разных клетках. И это особенно полезно, когда есть точки ветвления или когда клетка тянется в разных направлениях».

Результаты объединения стохастической модели с тематической моделью поразительны. Например, TopicVelo смогла реконструировать траектории, для восстановления которых ранее требовались специальные экспериментальные методы. Эти улучшения значительно расширяют потенциальные возможности применения.

Гао сравнил выводы статьи с самой статьей — продуктом многих областей исследований и опыта.

«В PME, если у вас есть проект по химии, скорее всего, над ним работает студент-физик или инженер-технический специалист», — сказал он. «Это никогда не бывает просто химией».

Больше информации:
Ченг Франк Гао и др., Рассечение и интеграция бурной транскрипционной динамики для сложных систем, Труды Национальной академии наук (2024). DOI: 10.1073/pnas.2306901121

Предоставлено Чикагским университетом

Цитирование: Получение динамической информации из статических снимков (27 апреля 2024 г.), получено 29 апреля 2024 г. с https://phys.org/news/2024-04-dynamic-static-snapshots.html.

Этот документ защищен авторским правом. За исключением любых добросовестных сделок в целях частного изучения или исследования, никакая часть не может быть воспроизведена без письменного разрешения. Содержимое предоставлено исключительно в информационных целях.

Поделиться в соцсетях