PolyAnalyst-H™
Анализ Big Data — это легко
Анализ Big Data — это легко
Объем ваших данных увеличивается в геометрической прогрессии? Вы уже не в состоянии не только анализировать эти данные, но и хранить их на отдельном компьютере? Добро пожаловать в мир больших данных… Здесь играть приходится по другим правилам, однако повода для беспокойства нет: мы решим ваши задачи. Компания Megaputer предлагает своим клиентам простой в использовании комплекс программных средств для выполнения глубокого анализа больших данных — PolyAnalyst-H™.
PolyAnalyst-H упрощает хранение и анализ Big Data на кластере машин относительно небольшой мощности, работающих в среде Hadoop®. Все задачи по преобразованию и анализу данных разбиваются на мелкие подзадачи, которые выполняются по расписанию разными узлами кластера.
PolyAnalyst-H позволяет специалистам по обработке и анализу больших данных использовать возможности распределенных вычислений. Пользователи могут выполнять анализ данных на кластерах, состоящих из нескольких узлов, используя знакомый и простой GUI-интерфейс PolyAnalyst™. Графический интерфейс пользователей позволяет решить типичную для обработки и управления Big Data проблему и отказаться от составления сложного программного кода.
PolyAnalyst-H меняет парадигму анализа данных: вместо того, чтобы загружать все данные на отдельный компьютер или сервер и анализировать их централизованно, PolyAnalyst-H координирует работу нескольких аналитических узлов, собирая результаты анализа подмассивов данных с отдельных машин, объединенных в кластер Hadoop. Работая параллельно друг с другом, эти аналитические узлы решают индивидуальные подзадачи и сообщают результаты серверу PolyAnalyst-H, который подводит общие итоги аналитического проекта.
Распределение масштабных и интенсивных вычислений между отдельными узлами кластера позволяет серверу PolyAnalyst-H решить две ключевых задачи. Во-первых, благодаря этому пользователь может обрабатывать Big Data, с которыми не в состоянии справиться отдельная машина. Во-вторых, существенно увеличивается скорость работы. При увеличении количества узлов в кластере, скорость анализа большого текстового контента с помощью PolyAnalyst-H возрастает линейно.
Возможности инструментов текстового анализа на базе платформы PolyAnalyst-H значительно превосходят потенциал других инструментов обработки Big Data, в основе которых лежит простой поиск ключевых слов. PolyAnalyst-H позволяет выполнять глубокий лингвистический и семантический анализ текстовых данных большого объема. Кроме того, поддерживается поиск текстовых шаблонов на основе выражений XPDL™. Благодаря использованию не имеющих аналогов средств текстовой аналитики, PolyAnalyst-H позволяет находить наиболее эффективные решения многочисленных сложных задач по обработке Big Data (например, данные о страховых претензиях и выплатах, медицинские карты пациентов, научная литература, отчеты о побочных эффектах от приёма лекарственных препаратов, и многое другое).
Hadoop® — зарегистрированная торговая марка фонда Apache Software Foundation.