Ученые включают в список суперкомпьютеры, машинное обучение, чтобы автоматически определить опухоли головного мозга

Джордж Бирос, преподаватель машиностроения и лидер ЛЕДЯНЫХ Алгоритмов Параллели для Data Analysis and Simulation Group в Техасском университете в Остине, работал в течение почти десятилетия, чтобы создать точные и эффективные вычислительные алгоритмы, которые могут характеризовать глиомы, наиболее распространенный и агрессивный тип первичной опухоли головного мозга.На 20-й Международной конференции по вопросам Медицинского Вычисления Изображения и Вмешательства Компьютера, которому Помогают (MICCAI 2017), Шариковые ручки и сотрудники из Университета Пенсильвании (во главе с профессором Кристосом Дэвэцикосом), Университет Хьюстона (во главе с профессором Андреасом Мангом) и Университет Штутгарта (во главе с профессором Мириам Мель), представленные результаты нового, полностью автоматического метода, который объединяет биофизические модели роста опухоли с алгоритмами машинного обучения для анализа данных об отображении Магнитного резонанса (MR) больных глиомой. Все компоненты нового метода были позволены суперкомпьютерами в Texas Advanced Computing Center (TACC).

Команда шариковых ручек проверила их новый метод в Многомодальной проблеме Сегментации Опухоли головного мозга 2017 (BRaTS ’17), ежегодные соревнования где исследовательские группы со всего мира настоящие методы и результаты для автоматизированной идентификации и классификации опухолей головного мозга, а также различных типов злокачественных регионов, используя дооперационные просмотры Г-НА.Их система, выигранная в лучших 25 процентах в проблеме и, была около вершины для целой сегментации опухоли.

«Соревнование связано с характеристикой неправильной ткани на пациентах, которые страдают от опухолей глиомы, самой распространенной формы первичной опухоли головного мозга», сказал Бирос. «Наша цель состоит в том, чтобы взять изображение и очертить его автоматически и определить различные типы неправильной ткани – отек, увеличив опухоль (области с очень агрессивными опухолями), и некротической ткани. Это подобно делению снимка семьи и выполнения распознавания лиц, чтобы опознать каждого участника, но здесь Вы делаете признание ткани, и все это должно быть сделано автоматически».

Обучение и тестирование трубопровода предсказанияДля проблемы, Шариковых ручек и его команды больше чем дюжины студентов и исследователей, были обеспечены заранее с 300 наборами изображений мозга, на которых все команды калибровали свои методы (что называют «обучением» в языке машинного обучения).В заключительной части проблемы группам дали данные от 140 пациентов и должны были определить местоположение опухолей и сегментировать их в различные типы ткани в течение всего двух дней.«В том 48-часовом окне нам была нужна вся вычислительная мощность, которую мы могли получить», объяснил Бирос.

У обработки изображения, анализа и трубопровода предсказания, который использовали Шариковые ручки и его команда, есть два главных шага: контролируемое машинное обучение ступает, где компьютер создает карту вероятности для целевых классов («целая опухоль», «отек», «ядро опухоли»); и второй шаг, где они объединяют эти вероятности с биофизической моделью, которая представляет, как опухоли растут в математических терминах, который накладывает ограничения на исследования и помогает найти корреляции.TACC вычислительные ресурсы позволил команде Шариковых ручек использовать крупномасштабные самые близкие соседние классификаторы (метод машинного обучения). Для каждого voxel или трехмерного пикселя, в изображении мозга Г-НА, система пытается найти весь подобный voxels в мозгах, которые это уже видело, чтобы определить, представляет ли область опухоль или неопухоль.С 1,5 миллионами voxels за мозг и 300 мозгов, чтобы оценить, который означает, компьютер должен посмотреть на пятьсот миллионов voxels для каждого нового voxel 140 неизвестных мозгов, которые это анализирует, решая для каждого, представляет ли voxel опухоль или здоровую ткань.

«Мы использовали быстрые алгоритмы и приближения, чтобы сделать это возможным, но нам все еще были нужны суперкомпьютеры», сказал Бирос.Каждый из нескольких шагов в аналитическом трубопроводе используемый отдельный TACC вычислительные системы. Самый близкий соседний компонент классификации машинного обучения одновременно использовал 60 узлов (каждый состоящий из 68 процессоров) на Stampede2, последнем суперкомпьютере TACC и одной из самых сильных систем в мире. (Шариковые ручки были среди первых исследователей, которые получат доступ к суперкомпьютеру Stampede2 весной, и смогли проверить и настроить его алгоритм для новых процессоров там.) Они использовали Lonestar 5, чтобы управлять биофизическими моделями и Индивидуалистом, чтобы объединить сегментации.Большинство команд должно было ограничить сумму данных тренировки, которые они использовали, или примените более упрощенные алгоритмы классификатора на целый учебный набор, но приоритетный доступ к экосистеме TACC суперкомпьютеров означал, что команда Шариковых ручек могла исследовать более сложные методы.

«Джордж приехал к нам перед проблемой BRaTS и спросил, могли ли бы они заставить приоритетный доступ к Stampede2, Lonestar5 и Индивидуалисту гарантировать, что их рабочие места прошли вовремя, чтобы закончить проблему», сказал Билл Барт, директор TACC по Высокоэффективному Вычислению. «Мы решили, что просто увеличение их приоритета, вероятно, не сократит его, таким образом, мы решили дать им резервирование на каждой системе, чтобы удовлетворить их потребности в течение 48 часов проблемы».Как оказалось, Шариковые ручки и его команда смогли управлять своим аналитическим трубопроводом на 140 мозгах меньше чем через 4 часа и правильно характеризовали данные о тестировании почти с 90-процентной точностью, с сопоставимо с человеческими радиологами.Их метод полностью автоматический, Бирос сказал и нуждался в только небольшом количестве начальных алгоритмических параметров, чтобы оценить данные изображения и классифицировать опухоли без любого практического усилия.Интеграция разнообразного исследования

Масштабируемая, основанная на биофизике аналитическая система команды изображения была кульминацией 10 лет исследования множества вычислительных проблем, согласно Шариковым ручкам.«В нашей группе и группах наших сотрудников, у нас есть многократные нити исследования согласно анализу изображения, масштабируемому машинному обучению и числовым алгоритмам», объяснил он. «Но это было первым разом, когда мы соединяем все для заявления заставить наш метод работать на действительно сложную проблему. Это не легко, но это очень выполняет».

Соревнование BRaTS таким образом представляет поворотный момент в его исследовании, сказал Бирос.«У нас есть все инструменты и основные идеи, теперь мы полируем его и видим, как мы можем улучшить его».Классификатор сегментации изображения собирается быть развернутым в Университете Пенсильвании к концу года в сотрудничестве с его сотрудником, Кристосом Дэвэцикосом, директором Центра Биомедицинского Вычисления Изображения и Аналитики и преподавателя Рентгенологии там.

Это не будет замена для радиологов и хирургов, но это улучшит воспроизводимость оценок и потенциально ускорит диагнозы.Методы, которые разработала команда, идут вне идентификации опухоли головного мозга.

Они применимы ко многим проблемам в медицине, а также в физике, включая полупроводниковый дизайн и плазменную динамику.Сказанные Шариковые ручки: «Наличие доступа к суперкомпьютерам TACC делает нашу жизнь бесконечно легче, делает нас более продуктивными и является реальным преимуществом».