Технический директор компании Fujitsu Джозеф Регер заявил, что 2018 г. станет годом искусственного интеллекта (ИИ). Его мнение разделяют аналитики компании IDC, которые прогнозируют, что всего через два года расходы на использование искусственного интеллекта во всем мире вырастут до 47 млрд. долларов. Какие же сферы нашей жизни будут трансформированы в первую очередь?
Во-первых, в течение 2018 г. мы будем наблюдать увеличение количества виртуальных помощников и чат-ботов, которые в настоящий момент используются только банками и страховыми компаниями. Более того, к 2020 г. пользователи уже не будут замечать, что интерфейс множества систем не является человеческим. Во-вторых, многие страны начнут инвестировать в ИИ для повышения качества медицинского обслуживания и сокращения расходов. Особое внимание будет уделяться технологиям, которые смогут ускорить постановку диагноза, и решениям для профилактики заболеваний. В-третьих, появится принципиально новый рынок труда в рамках концепции искусственного интеллекта, но на этом этапе технологии еще не заменят традиционных сотрудников компаний. По мере того как системы на базе ИИ будут автоматизировать многие традиционные виды деятельности, к 2020 г. возникнут проблемы на рынке труда.
Наконец, в течение 2018 г. во всех сферах производства в той или иной степени будут использоваться ИИ-технологии, включая логистику и техническое обслуживание. Сейчас роботы работают за специально установленными ограждениями, однако новое поколение «умных» автономных роботов сможет безопасно работать совместно с людьми. Роботы будут поднимать тяжелые детали и выполнять рутинные задачи.
«Умная» одежда и слежение за младенцами
Сегодня в области биологии ведущими являются три направления исследований, которые используют последние достижения искусственного интеллекта (то есть, в основном глубокие нейронные сети) для биомедицинских приложений. Возможно, именно эти исследования не только изменят, но и существенно продлят нашу жизнь. Речь пойдёт о применении ИИ для так называемого «Интернета вещей» (Internet of things, IoT), причём применении, очень «близкого к телу». В нашу жизнь давно вошли разного рода фитнес-трекеры, специальные браслеты, собирающие информацию о пульсе, шагах и тому подобном.
Основной тренд в компаниях, производящих спортивную одежду, сейчас заключается в том, чтобы встраивать разные датчики прямо в одежду. Так можно собирать больше информации и измерять её точнее. Подходящие для «умной» одежды сенсоры изобрели в 2016 г., а уже в 2017 году компания Polar представила Polar Team Pro Shirt, футболку, которая собирает массу информации во время спортивных занятий. Однако самое интересное начнётся позже, когда спортивная медицина при участии искусственного интеллекта научится правильно использовать всю эту информацию. В ноябре 2017 г. в Москве проходил второй хакатон (форум разработчиков) SkinHack, посвящённый применению моделей машинного обучения к анализу данных, поступающих с такой футболки.
Первый SkinHack, проходивший в 2016 году, был посвящён «умной» косметике: участники пытались предсказать возраст человека по структуре кожи на фотографиях и искать на них морщины. И «умной» косметикой, и «умной» одеждой активно интересуется Beiersdorf AG (в миру известный под брендом Nivea), так что можно надеяться, выход на рынок всех этих технологий тоже не заставит себя ждать.
В свою очередь, компания InSilico Medicine, которая ищет средства против старения, затеяла не менее увлекательный и важный проект — автоматический поиск действующих веществ для создания новых лекарств. Лекарство – это химическое соединение, которое умеет связываться с другими веществами в нашем организме (обычно с белками), чтобы исправить в них то, что требуется: например, один белок подавить, а другой, наоборот, начать производить в большем количестве.
Чтобы создать новое лекарство, нужно научиться выбирать из огромного числа вариантов химических соединений именно те, которые будут иметь нужное воздействие. Понятно, что полностью автоматизировать поиск новых действующих веществ невозможно: нужны клинические испытания сначала на животных, потом на людях… В общем, процесс вывода на рынок нового препарата обычно растягивается на годы.
Однако можно попробовать помочь медикам, сократив поиск. В компании InSilico разрабатывают модели машинного обучения, которые пытаются не просто предсказать, какими свойствами будут обладать те или иные молекулы, но и породить молекулы с заданными свойствами, тем самым помогая выбрать самых перспективных кандидатов для лабораторных и клинических исследований. Делают это при помощи очень интересной модели глубокого обучения: порождающих соперничающих сетей (generative adversarial networks, GAN). В таких сетях есть два компонента: генератор пытается породить новые объекты (например, новые молекулы с нужными свойствами), а дискриминатор пытается отличить то, что он нагенерировал, от настоящих данных. Обучаясь обманывать дискриминатор, генератор начинает порождать объекты, неотличимые от настоящих… Последняя модель InSilico druGAN (drug плюс GAN) пытается порождать в том числе молекулы, которые будут полезны для лечения онкологических заболеваний.
MonBaby – очень интересная разработка компании Neuromation. Маленькие дети, особенно младенцы, которые не всегда могут сами позвать на помощь, требуют особого ухода и внимания. Причём внимание иногда требуется даже в ситуациях, когда маме с папой, казалось бы, можно расслабиться: например, спящий младенец неудачно поворачивается и повреждает ножку. А есть и пресловутый SIDS (синдром внезапной детской смерти), риск которого существенно зависит от позы, в которой младенец спит. Наиболее опасным считается положение спящего ребенка на животе.
Умная система слежения за младенцами MonBaby представляет собой небольшую «кнопку», которая крепится на одежду и следит за дыханием ребёнка и тем, как он переворачивается во сне. Сейчас эта система основана на машинном обучении для анализа временных рядов: поступающие от перемещений ребёнка данные используются для того, чтобы распознавать циклы дыхания и то, на животе или спине спит младенец.
К этой системе планируют добавить ещё и умные камеры, которые смогут отслеживать движения ребёнка и всё, что с ним происходит, по изображениям. Здесь пригодятся системы компьютерного зрения, основанные на глубоких свёрточных сетях, и синтетические данные для их обучения. Дело в том, что собрать достаточно большой набор настоящих данных для обучения системы в данном случае практически невозможно: потребовались бы не просто реальные видеозаписи десятков тысяч младенцев, но и видеозаписи, в которых встречались бы все возможные критические ситуации, – в наше время и медицинская, и общечеловеческая этика такие наборы данных собирать не разрешает. Поэтому планируется создавать «виртуальных младенцев», 3D-модели, которые позволят смоделировать нужные ситуации и смонтировать искусственные видеоролики для обучения.
Компьютерное зрение
Множество разработок систем ИИ, которые ведутся уже много лет, в ближайшем будущем будут внедряться в финансах и сфере безопасности. В 1981 г. Нобелевскую премию по физиологии и медицине получил нейрофизиолог Дэвид Хьюбел. Его работа Brain mechanisms of vision касалась обработки информации в зрительном анализаторе. Вместе с Торстеном Визелом он проводил эксперимент, помещая микроэлектрод в зрительные центры коры головного мозга кошек и обезьян и фиксируя спонтанную активность нервной клетки, в которую был имплантирован этот микроэлектрод. Ученые выяснили, как различные компоненты изображения на сетчатке считываются и интерпретируются клетками коры головного мозга. Это открытие легло в основу компьютерного зрения. Что же это такое? Есть несколько способов научить машину распознавать кошек и собак. Первый – задать алгоритм, описывающий животных определенным образом относительно друг друга. Очевидно, что универсальных параметров почти нет: например, кошки не всегда меньше собак и т.д. Другой способ – показать очень много фотографий с кошками и собаками, обозначив их. Примерно так ребенок учится узнавать животных, поэтому мы с вами при встрече даже с экзотической кошкой, как правило, безошибочно понимаем, что перед нами именно она. Этот пример демонстрирует два разных подхода к обучению машин: описание алгоритмами (знаниями) и представление, зрительное обучение (компьютерное зрение). Оба этих подхода уже применялись в медицине.
Анализ медицинских изображений – один из самых распространенных способов диагностики. Первые интеллектуальные системы, помогающие рентгенологам в обработке диагностических изображений, – CAD-системы (computer-aided diagnostic) – появились более 40 лет назад и внедрялись многими известными поставщиками ПО и оборудования для рентгенологии. CAD-системы построены на основе традиционных алгоритмов обработки изображений и не используют ИИ. Рентгенологи очень редко применяют такие системы в своей работе из-за низкой точности постпроцессинговой обработки изображений.
Но в последние пять лет эффективное распознавание изображений стало наиболее динамично развивающимся направлением в ИИ. Это связано с несколькими факторами. Во-первых, скопились большие объемы данных, необходимых для обучения нейронных сетей. Во-вторых, значительно усовершенствовались математические алгоритмы и, прежде всего, технология глубоких сверточных сетей, которая сейчас признается в ИИ топовой для распознавания изображений. Эти же сети используются для распознавания голоса. Наконец, игровые графические процессоры, или видеокарты, стали значительно эффективнее. Именно мощности этих видеокарт позволяют обрабатывать информацию с высокой точностью и добиваться результатов, которые раньше были невозможны. В 2012 г. сочетание этих факторов привело к значительному прогрессу в развитии технологий компьютерного зрения и способствовало их коммерческому использованию в различных областях: обнаружение объектов, распознавание лиц на фото или видео. Подобные графические процессоры используются также при майнинге криптовалют.
Новые возможности медицинской диагностики
В мире уже есть системы, которые способны обрабатывать данные для распознавания разных заболеваний. Сегодня стало возможным создание системы, которая будет анализировать все доступные данные о пациентах безотносительно нозологии и, например, не пропустит сигнал о новообразовании на КТ-исследовании, на котором врач смотрит лишь перелом ключицы. Подобная комплексная модель позволит избежать диагностических ошибок. Для этого необходимо использование гетерогенных медицинских данных, то есть, не только изображений, но и клинических данных из электронных медкарт и неструктурированных медицинских данных (например, описание изображения рентгенологом). Важно, чтобы эта система могла не только выдать результат, но и показать врачу, какая информация стала для нее решающей при постановке диагноза.
Именно сложности построения математических моделей пациентов с использованием всех данных по разным заболеваниям и отсутствие возможности увидеть логику выведенного ИИ результата – главные проблемы на пути дальнейшего развития технологии. Если врач будет видеть, на какие факторы обратил внимание ИИ при выдаче прогноза, то станет больше доверять ИИ, и корректировки для дальнейшего обучения системы будут более точными. Это удивительная история, в которой чистая математика встречается с медицинским знанием. Именно на ее разработку сейчас брошены силы IBM, Amazon, многих других корпораций, а также небольших стартапов (бизнес-начинаний). Сегодня сроки создания подобных проектов сокращаются за счет наличия опенсорсных программ (опенсорсный – свободно распространяющееся программное обеспечение (ПО), без лицензий). И теперь вопрос не столько в технологической разработке, сколько в создании продукта, который будет востребован и органично встроен в существующие диагностические бизнес-процессы.
Трудно оценить скорость повсеместного внедрения подобных систем. Но, исходя из динамики развития инвестиций в подобные проекты и опросов участников отрасли, можно предположить, что в течение 5 лет половина врачей будет пользоваться подобными системами как минимум в США. Китай и Соединенные Штаты вкладывают огромные средства в развитие ИИ. В США минимальные инвестиции на начальной стадии такого проекта стартуют от 1 млн. долларов. При этом нужно понимать, что научная база этой предметной области – математика.
По материалам «Инвест-Форсайт»