ВСЛУХ

Наука становится менее человечной

Наука становится менее человечной
В этом году препарат, предназначенный для лечения хронического неизлечимого легочного заболевания, вошел в фазу тестирования на людях. Предыдущие исследования показали, что препарат безопасно принимать, однако пока неизвестно, сможет ли он победить симптомы фиброза; именно это тестируют в текущем исследовании. Возможно, результаты будут известны к следующему году. Это достижение не было бы примечательным, если бы не особенность разработки данного препарата: это первый полностью разработанный искусственным интеллектом препарат, достигший такого уровня в развитии.


Производитель препарата, биотехнологическая компания Insilico Medicine, использовала сотни моделей ИИ для открытия формулы, способной лечить фиброз, и определения молекул, которые могут быть синтезированы для самого препарата. Благодаря ИИ Insilico смогла пройти путь от нуля до первой фазы клинических испытаний на людях за два с половиной года, вместо обычных пяти. Даже если препарат окажется бесполезным, что вполне может быть, уже существует множество других лекарств, разработанных с помощью ИИ. Ученые надеются, что они достигнут аптек значительно быстрее, чем традиционно разработанные лекарства. Обычно вывод медпрепарата на рынок занимает более десяти лет, а вероятность неудачи достаточно высока.

Медицина — лишь один аспект более общей трансформации в науке. За последние несколько месяцев ИИ, похоже, предсказывает тропические ураганы с такой же точностью, но намного быстрее, чем обычные модели; Meta выпустила модель, способную анализировать мозговые сканы для воссоздания того, на что человек смотрит; Google недавно использовал ИИ для предложения миллионов новых материалов, которые могут улучшить суперкомпьютеры, электромобили и многое другое. Как и в случае с тем, как технология стирает границу между тем, что создано человеком, и тем, что создано компьютером, изменяя то, как люди работают, учатся и общаются, инструменты ИИ ускоряют и изменяют некоторые основные аспекты науки.

Наука никогда не развивалась так быстро, как сегодня. Однако внедрение искусственного интеллекта, в некотором смысле, делает науку менее человечной. В течение веков наши знания о мире были основаны на его наблюдении и объяснении. Многие современные модели искусственного интеллекта исказили эту деятельность, предоставляя ответы без обоснования и заставляя ученых изучать не только природу, но и анализировать алгоритмы. Таким образом, искусственный интеллект может поставить под сомнение саму природу открытий.

ИИ существует для извлечения поразительно сложных закономерностей из наборов данных, слишком огромных для восприятия любого человека. Этот загадочный феномен стал ближе к людям с выпуском ChatGPT в прошлом году. Чат-бот, инструмент, получивший практически глобальное распространение, кажется способным заново синтезировать всемирную паутину, изменил способ, которым мы получаем и применяем знание, но в то же время привнес повод для сомнений. Мы точно не понимаем, как генеративные чат-боты на базе ИИ генерируют свои ответы. Ясно одно: они звучат удивительно человечно. И это затрудняет определение того, что является реальным, логичным или достоверным.

ИИ может делать нечто невероятное в широком спектре научных дисциплин. Одними из наиболее заметных научных достижений, достигнутых с помощью ИИ, являются достижения в молекулярной биологии, которые связаны с DeepMind, ведущей лабораторией по искусственному интеллекту, теперь базирующейся в Google. После того, как программы DeepMind победили в игре Го в 2016 году — игре, которая гораздо более сложна, чем шахматы, и многие считали, что компьютеры не смогут ее овладеть — Демис Хассабис, генеральный директор DeepMind, рассказал, что начал задумываться о том, как создать программу искусственного интеллекта для десятилетней проблемы свертывания белка.

Множество биологических процессов зависит от белков, и каждый белок состоит из последовательности аминокислот. То, как эти молекулы складываются в трехмерную форму, определяет функцию белка, и картографирование этих структур может помочь ученым разрабатывать новые вакцины, уничтожать бактерии, устойчивые к антибиотикам, и исследовать новые методы лечения рака. Без трехмерной формы белка у ученых есть только группа кирпичиков Лего без инструкций, как их собрать вместе.

Раньше требовалось годы, чтобы определить структуру одного белка по последовательности аминокислот. Но в 2022 году прорывная научная модель DeepMind, AlphaFold, нашла наиболее вероятную структуру почти каждого из 200 миллионов известных науке белков. Аналогично программам, разработанным компанией для шахмат и Го, которые ищут наилучший ход, AlphaFold исследует возможные структуры для последовательности аминокислот, чтобы найти наиболее вероятную. Программа сокращает время работы, которая раньше могла занимать целый докторский путь, до считанных секунд. Тем не менее, независимые исследователи отметили, что несмотря на сверхчеловеческую скорость, модель не объясняет полностью, почему определенная структура является наиболее вероятной. В результате ученые пытаются разобрать прогнозы AlphaFold, и стоит отметить, что в этих усилиях делается хороший прогресс.

Искусственный интеллект позволяет исследователям изучать сложные системы в «мире битов» гораздо быстрее, чем в «мире атомов», а затем физически проверять свои гипотезы в качестве завершающего шага.

Эта технология продвигает прогресс во многих других областях, не только улучшая скорость и масштаб, но и меняя представление о возможных исследованиях. Нейроученые в Meta и в других местах, например, превращают искусственные нейронные сети, обученные «видеть» фотографии или «читать» текст, в гипотезы о том, как мозг обрабатывает как изображения, так и язык. Биологи используют ИИ, обученный на генетических данных, для изучения редких заболеваний, улучшения иммунотерапий и более глубокого понимания вариантов SARS-CoV-2, вызывающих озабоченность.

Теперь у нас есть реальные гипотезы, где раньше были загадки

— Джим Дикарло, нейроученый из Массачусетского технологического института, который начал использовать ИИ для изучения зрения в мозге.

Астрономы и физики используют машинное обучение для обработки массивов данных о вселенной, с которыми раньше было невозможно справиться. Некоторые эксперименты, такие как частицы разогнанного коллайдера ЦЕРН, производят слишком много информации для физического хранения. Исследователи полагаются на ИИ, чтобы отфильтровать знакомые наблюдения, сохраняя неизвестные для анализа.

Мы не знаем, как выглядит иголка, потому что это недетектированные физические события, но мы знаем, как выглядит сено. Так что компьютеры обучены распознавать сено и просто выбрасывать его

— Александр Залай, директор Института интенсивной обработки данных.

Долгосрочное видение даже может включать сочетание моделей искусственного интеллекта и физических экспериментов в своеобразную «автономную лабораторию». В таких лабораториях компьютерные программы и роботы генерируют гипотезы, планируют эксперименты для их проверки и анализируют результаты. Подобные лаборатории являются отдаленной перспективой, хотя прототипы уже существуют, например, Scientific Autonomous Reasoning Agent — роботизированная система, которая уже обнаружила новые материалы для возобновляемой энергии. SARA использует лазер для итеративного анализа и изменения материала, каждая итерация длится несколько секунд, сокращая дни исследований до часов. Если эта перспектива реализуется, программное обеспечение и роботы поднимутся на новый уровень, став фактически соавторами.

Наблюдения в квантовом масштабе, непосильные для обработки человеком, эксперименты, слишком быстрые для выполнения, сложные нейронаучные гипотезы — ИИ делает возможной научную работу, которая раньше казалась невозможной. Но эти же инструменты создают эпистемологическую проблему. Они генерируют революционные знания, разрушая при этом понимание самой сути знания.

Чтобы понять явление, будь то поведение клетки или планетарная система, необходимо уметь идентифицировать причины и следствия. Но модели искусственного интеллекта известны своей непрозрачностью. Они обнаруживают закономерности на основе гигантских наборов данных с использованием программных архитектур, внутреннее устройство которых удивляет человеческую интуицию и логику. Эксперты называют их «черными ящиками».

Это создает очевидные проблемы для научного метода. Ученые должны понять, что происходит внутри этого черного ящика, чтобы увидеть первоисточник открытия. Предсказывать события, не понимая, почему эти предсказания верны, может указывать на другой тип науки, в которой знания и результатирующие действия не всегда сопровождаются объяснением. Модель ИИ может предсказать приход грозы, но будет затрудняться объяснить базовую физику и изменения в атмосфере, которые ее вызвали, анализировать рентгеновский снимок, не показывая, как она пришла к определенному диагнозу, или предлагать абстрактные математические гипотезы без их доказательства.

Такие сдвиги от наблюдений и обоснованного рассуждения к математической вероятности уже происходили в науках ранее: уравнения квантовой механики, возникшие в 20-м веке, точно предсказывают явления в микромире, которые физики до сих пор не полностью понимают, вплоть до того, что сам Альберт Эйнштейн сомневался в связи с квантовой теорией.

Сама наука может предложить решение этой проблемы. Физические эксперименты за прошедший век разрешили множество вопросов о квантовом мире, и подобным образом, инструменты ИИ могут казаться непостижимыми частично потому, что исследователи не проводили достаточно времени на их изучение.

Сначала нужно создать артефакт, прежде чем мы сможем его разобрать и научно анализировать

— Демис Хассабис.

Ученые только недавно начали создавать ИИ-модели, достойные исследования. Даже старые численные симуляции, хотя и гораздо менее сложные, чем модели ИИ сегодня, трудно интерпретировать интуитивно, но они все же способствовали новым открытиям на протяжении десятилетий.

Если исследователи поймут, как искусственные нейроны реагируют на изображение, они могут транслировать эти предсказания на биологические нейроны. Если станет ясно, какие части ИИ-модели связывают мутацию с болезнью, ученые смогут получить новые представления о геноме человека.

Такие модели являются полностью наблюдаемыми системами. В то время как ученый не может измерить каждый нейрон и синапс в мозге обезьяны во время операции, он может сделать это для модели ИИ. При правильном подходе программы ИИ могут представить ученым не черные ящики, а новый тип объекта, требующий нового типа исследования — не «модели» природного мира, а дополнения к нему. Некоторые ученые даже надеются создать «цифровых двойников», чтобы моделировать клетки, органы и даже планеты.

ИИ не является универсальным решением. AlphaFold может быть революционной технологией, и возможно, Insilico действительно сократит время на разработку новых лекарств. Но у этой технологии есть значительные ограничения. Например, моделям ИИ необходимо обучаться на больших объемах соответствующих данных. AlphaFold — впечатляет, но он все же опирался на очень дорогие, тщательно подготовленные данные, полученные на протяжении десятилетий в лаборатории по четко сформулированной проблеме, которая может быть очень четко оценена. Отсутствие высококачественных данных в других областях может препятствовать или ограничивать использование ИИ.

Даже с этими данными реальный мир может быть более сложным и динамичным, чем цифровая модель. Перевод статической структуры молекулы во взаимодействие с различными системами организма, например, является проблемой, над которой исследователи все еще работают

— Андреас Бендер, изучающий молекулярную информатику в Кембриджском университете.

В лабораторных условиях новые прогнозы можно физически и безопасно проверять в изолированной среде. Но когда дело касается разработки лекарств или лечения пациентов, ставки гораздо выше. Существующие карты генома человека, например, представляют из себя искаженное представление. Так большинство данных сегодня относятся к белым европейцам, но проявление многих состояний, таких как диабет, значительно варьируется в зависимости от расы и этничности. Искаженные наборы данных приводят к расистским чатботам, и это значит, что модели не применимы для людей иного происхождения или различного возраста. Программа диагностики рака или лечение, разработанное искусственным интеллектом, может оказаться эффективным только для определенной части населения.

Клинические испытания занимают годы, и многие из них оказываются неудачными; многие стартапы в области ИИ-лекарств оказываются по факту провальными. Эти неудачи являются, в некотором смысле, доказательством работающей науки. Экспериментальные результаты, вместе с известными физическими законами, позволяют ученым предотвращать появление галлюцинаций в их моделях. Но для чатботов аналогичных законов лингвистической точности не существует — потребители должны доверять Большим Технологиям

— Анима Анандкумар, компьютерный ученый из Калтеха.

Модели искусственного интеллекта могут преобразовать не только наше понимание мира, но и сам процесс понимания. Если это так, нам также необходимо развивать новые модели знаний — то, во что мы можем верить, почему и когда. В противном случае, наше полагание на чатбота, как инструмент разработки лекарств или прогнозы ИИ о погоде могут уйти далеко от реальной науки и станут больше напоминать веру.

Автор:

Мы в Мы в Яндекс Дзен
Лучшие роботы с Всемирной агропромышленной выставки – 2023Вычислительная модель поможет медикам в разработке лекарства от диабета