Анализ научной литературы
Отделяйте зерна от плевел
Отделяйте зерна от плевел
Объем научной литературы, которую исследователям приходится изучать для того, чтобы быть в курсе всех новейших разработок и последних открытий в той или иной области, увеличивается в геометрической прогрессии. В ходе проведения научных и промышленных исследований возникает необходимость извлечения, резюмирования и структуризации интересующей информации из огромного количества статей, патентной документации и документов о проведении клинических испытаний.
PubMed, наиболее часто используемый ресурс, данные которого применяются в фармацевтической и медико-биологической промышленности, содержит более 28 миллионов публикаций. Тысячи новых статей добавляются в базу данных ежедневно. При таком огромном количестве данных традиционная обработка новых источников вручную больше не представляется возможной. В связи с этим современным исследователям просто необходимы автоматизированные инструменты для быстрого, эффективного, целенаправленного текстового анализа с большой пропускной способностью.
Компания Megaputer предлагает решение для автоматического анализа текстов с результатами научных и промышленных исследований. Оно позволяет пользователям в автоматическом режиме извлекать ключевую информацию и структурировать ее с целью последующего анализа. К ключевой информации могут относиться сущности из сферы медико-биологических наук (лекарства, заболевания, биомаркеры, химические вещества, белки, демографические данные пациентов, симптомы заболеваний), а также любые другие интересующие исследователей сущности, их отношения и факты. Решение позволяет выявлять актуальные темы исследований и основные тенденции. Оно позволяет получить результаты большой точности в максимально короткие сроки.
Решение может работать напрямую с базами данных PubMed или cancer.gov. Вы также можете анализировать статьи разного формата, хранящиеся в вашем репозитории, или в автоматическом режиме сканировать веб-страницы с целью поиска и извлечения интересующих вас данных.
Решение извлекает и нормализует стандартные сущности, например, названия белков, генов, химических веществ, медицинских препаратов и заболеваний. Оно может выявлять в тексте и другие сущности, отношения и факты на основе заранее заданных или созданных пользователем поисковых запросов, которые могут извлекать лингвистические, семантические и лексикографические шаблоны из данных. Например, исследователи могут определить, какие гены и биомаркеры связаны с рассматриваемыми биологическими процессами, или насколько эффективны разные лекарственные препараты при лечении одного и того же заболевания.
Решение позволяет структурировать извлеченные данные и подготовить их для последующего анализа. Оно может резюмировать результаты исследования в виде интерактивных графических отчетов и создавать автоматические уведомления о событиях, которые могут заинтересовать пользователей.
Транснациональная фармацевтическая компания оценивает возможность создания новых лекарств для лечения аутоиммунного сахарного диабета. Компании требуется в очень краткие сроки проанализировать имеющиеся публикации для того, чтобы собрать информацию о проведенных клинических испытаниях для лечения аутоиммунного диабета, о белках, которые имеют решающее значение для диабетиков, о препаратах, которые используются для лечения диабета, а также об основных и наиболее авторитетных исследователях в данной области.