Технологии Big Data могут стать ключевым элементом реформы здравоохранения США
В одном из крупнейших медицинских комплексов Америки – Нью-Йоркском Маунт-Синай в дополнение к имеющемуся суперкомпьютеру стоимостью три миллиона долларов
США ежегодно тратит на здравоохранение более трёх триллионов долларов. Комплекс Маунт-Синай вместе с аффилированной медицинской школой ежегодно госпитализирует около полумиллиона человек. Число медицинских записей в электронной картотеке превысило 120 миллионов. Недавно к ним добавилась база данных биобанка, насчитывающая 26735 образцов ДНК. Обработка возрастающего количества разнородных данных – один из ярких примеров современных проблем ИТ-инфраструктуры и одна из типичных задач в области Big Data.
Ранее оперативно учесть сотни показателей работы медицинских учреждений было технически невозможно, поэтому на банковский счёт госпиталей поступали средства, пропорциональные общему числу койко-дней и количеству выполненных манипуляций. Из-за этого сформировалась порочная система, в которой выгодно было проводить избыточную диагностику, назначать лишние консультации и затягивать лечение.
Текущая реформа здравоохранения США использует возможности более тонкой работы с данными. Её авторы придерживаются концепции «подотчётной помощи», в рамках которой будет оцениваться, прежде всего, эффективность проведённого лечения. Таким образом, благодаря технологиям «больших данных», платить будут не столько за процесс лечения, сколько за способность быстро излечивать и поддерживать здоровье пациентов.
Один из привлечённых экспертов – сотрудник института геномики и биолог компании Pacific Biosciences Эрик Шад (Eric Schadt) так прокомментировал ситуацию изданию MIT Technology Review:
Это чудовищно огромная ставка на обработку больших объёмов данных. Новые экономические стимулы объясняют, почему госпитали вдруг стали испытывать такую высокую потребность в специалистах по вопросам Big Data. Только из нашего института в прошлом году было нанято сто пятьдесят человек.
Другим важным направлением стало прогнозирование расходов. Оно базируется на многофакторном анализе таких статистических данных, как число повторных обращений, процент жалоб на конкретных врачей и подразделения, распространённость различных патологий, количество пациентов с хроническими заболеваниями, а также эпидемиологических показателях. Все эти данные будут обрабатываться на новом кластере в свободно распространяемой системе распределённых вычислений Hadoop.