Неудача в управлении данными
Сбор и сортировка данных – один из самых важных инструментов для исследований. По словам Лауры Эссерман, которая возглавляет Центр Керол Бак по уходу за молочной железой при Калифорнийском университете в Сан-Франциско, наша нынешняя система «невероятно неэффективна».
Качественные данные – это основа всей работы при исследовании заболеваний, самая главная информация, которая необходима для достижения заявленной цели – предотвращения рака. Эффективная обработка данных, полученных клиническими и экспериментальными методами, позволяет нам получать знания и, опираясь на эти знания, двигаться вперед. Полученная информация проливает свет на то, как и на какую методику лечения пациент отреагировал лучше всего, что позволяет в дальнейшем распространять этот опыт лечения повсеместно. Обмен данными, получаемыми в ходе клинических испытаний, повышает объективность исследований, которые в противном случае расценивались бы как малодостоверные из-за ограниченного количества исследуемых или из-за слишком короткого промежутка исследования.
Рассмотрим важность качественных данных для персонифицированной медицины. Это молодая отрасль медицины, которая, по мнению многих, имеет колоссальный потенциал для создания новых методов профилактики и лечения на основе индивидуальных характеристик пациента или его опухоли.
Персонифицированная медицина контрастирует с принятым ныне «однотипным, универсальным подходом», как указывает Томас Дегнан, бывший руководитель отделения гематологии и онкологии, а также председатель отдела исследований больницы при Университете северного побережья в Массачусетсе, штат Нью-Йорк. Раковые опухоли имеют большие различия. Это проявляется в том, как они зарождаются, растут, распространяются в органе своего происхождения и за его пределами. Лечение, которое эффективно для одной группы пациентов, может нанести вред другой группе.
«У каждого человека рак имеет свои отличительные черты, свою «индивидуальную подпись». Это касается и его молекулярной структуры, и ответа опухоли на лечение, и общей выживаемости после лечения, – говорит доктор Дегнан. – Мы надеемся, что когда мы научимся читать эту индивидуальную подпись, то сможем гораздо лучше персонифицировать наш подход к лечению, включая сроки и методы вмешательства. Ключ к такому подходу дает сбор и анализ биомаркеров, или биологических индикаторов состояния болезни. Необходимо лишь понять, что именно биомаркеры предсказывают, и на основе этого выбрать подходящее лечение и своевременные сроки для него. Сроки проведения очень важны, ведь «вмешательство может произойти до того, как болезнь появится», – объясняет доктор Дегнан.
Эффективные системы данных очень важны для такого рода знаний. Авторы статьи в журнале Clinical Cancer Research описывают их необходимость так: «Создавая информационные сети, которые сопровождают пациентов в течение всей их жизни, и выявляя больных, у которых есть как клинические проявления, так и характерные молекулярные биомаркеры опухолевого процесса, исследователи и клиницисты смогут предсказывать клинический исход и определить степень необходимых диагностических и лечебных процедур для групп пациентов со схожими заболеваниями».
...
Проще говоря, хорошо управляемая информационная система «будет основой для обеспечения правильного лечения конкретного пациента в точно определенное для этого время и в точно определенной локализации в организме», – пишут они.
Помимо непосредственной выгоды для пациента, улучшение сбора данных способствует развитию науки. Каждый должен внести свой вклад в эту систему, и каждый должен получать доступ к знаниям, которыми эта система обеспечивает. Это касается врачей первичного звена, государственных и частных страховых компаний, исследователей, проводящих клинические испытания, эпидемиологов, собирающих данные эпидемиологического надзора. Все должны поставлять информацию, которая поможет соотнести полученные данные с конкретным пациентом. Затем каждый из участников этого процесса должен быть способен использовать полученные данные при назначении методов лечения или исследования.
Мы далеки от осуществления этого сценария. Опрос, проведенный в 2008 году, выявил, что только 1,5% из 3049 больниц, оказывающих экстренную помощь, установили современное оборудование для ведения медицинской документации в электронном виде. В добавление к этому, 7,6% из опрошенных больниц имели минимум таких систем, или, проще говоря, лишь в одном клиническом отделении.
Перед тем как записи в электронной медицинской книжке пациента будут доступны для всестороннего исследования, должны произойти значительные изменения. Кроме дополнительных финансовых издержек, для создания функциональной системы необходимо будет подготовить достаточное количество экспертов в области информационных технологий. Еще более сложной задачей будет создание совместимости этих электронных систем – их способности к обмену данными. Если даже в пределах одной больницы не может быть налажена система обмена данными между отделениями, представьте, как далеко мы находимся от выполнения нашей задачи по сбору информации из тысяч различных мест.
* * *
Хотя тот факт, что обмен электронными данными не внедрен в некоторых больницах и не в ходу между врачами, вызывает тревогу, отсутствие эффективной информационной системы в самом NCI просто поражает.
Попытка изменить это положение вещей была предпринята в 2004 году, когда при NCI была создана Сеть биомедицинской информации (caBIG). Одна из самых перспективных программ, caBIG должна была объединить все сообщество людей, работающих над проблемами рака, ученых, клиницистов, работников FDA, в одну совместную инфраструктуру для медицинских исследований.
В то время, как и сейчас, не существовало единой системы, позволяющей исследователям в области онкологии обмениваться информацией. Онкологический центр в Калифорнии, который проводил эксперименты с новыми химиотерапевтическими препаратами, не имел ни малейшего представления о результатах исследования тех же самых лекарств в онкологическом центре штата Мэн. Целью caBIG ставилась интеграция информации по проводимым исследованиям с однотипной тематикой. Например, объединить данные, полученные от нескольких исследователей, каждый из которых занимается вопросами возникновения опухоли или проблемой, почему опухоль перестала отвечать на проводимую терапию.
Сеть биомедицинской информации (caBIG), как предполагалось, сможет решить эту проблему путем добровольного обмена данными, что, в свою очередь, значительно ускорит научный процесс. Система была основана на технологии распределенных вычислений, позволяющей объединить множество отдельных компьютеров по всему миру в «виртуальный суперкомпьютер». Андреа Калифано, директор-основатель и председатель Геном-центра при Колумбийском университете, описывает эту технологию как способ «взять вычислительную программу и распространить ее через Интернет на любое число компьютеров». Калифано возглавлял рабочую группу Совета научных консультантов Национального института злокачественных новообразований (NCI). Рабочая группа должна была организовать работу caBIG по принципу облачного сервиса хранения и обработки информации, наподобие iCloud компании Apple.
Поразительной способностью caBIG является возможность собирать, интегрировать, анализировать и распространять огромные объемы информации. Для исследовательских проектов, в которых изучаются тысячи участков и белков ДНК, эта технология не только уменьшает количество трудоемкой аналитической работы по изучению опухолевых процессов, но и сама выполняет эту работу. «Если вы попытаетесь вычислить комбинацию вручную, то потерпите неудачу: числа будут слишком внушительны», – говорит Калифано.
...
Несмотря на стремление и надежды, которые на нее возлагались, программ caBIG была свернута. После 7 лет работы и истраченных 350 миллионов долларов, NCI наложил мораторий на ее использование.
В марте 2011 года рабочая группа Совета научных консультантов выпустила доклад, в котором говорилось, что сеть caBIG развилась далеко за пределы первоначально установленных для нее целей, «используя для этого чрезмерно сложное программное обеспечение».
Калифано был еще более откровенен. «CaBIG была мощной, передовой технологией, – говорит он, – но ее разработчики не имели ясного представления, как она будет использоваться. Это была классическая ситуация, когда телегу поставили впереди лошади. Вместо того чтобы насущные биологические проблемы определяли необходимое техническое обеспечение, у нас была развитая технология, ожидающая, когда появятся проблемы».
Главными недостатками оказались отсутствие независимого внешнего контроля, а также тот факт, что в бюджете сети не было предусмотрено средств на обучение работе с ней. Люди, которые могли бы воспользоваться информацией, представленной в caBIG, не умели ей пользоваться. «Эта система показала, что она не может помочь исследователям в их работе», – говорит Калифано. Технология распределенных вычислений продемонстрировала, что усложняет, а не упрощает обмен данными между исследователями. Гигантские суммы были потрачены на оплату внешних консультантов, у которых было недостаточно опыта и знаний в области клинической медицины. Вдобавок сложная многоуровневая система управления и привлечение дорогостоящих консультантов создали барьер между исследовательским сообществом и руководством caBIG.