Сентимент-анализ позволяет автоматизировать классификацию отзывов покупателей о товарах и услугах путем выявления положительной или отрицательной оценки авторов по отношению к объектам, о которых идет речь в текстах. Анализ тональности текста позволяет выявлять оценочные слова и фразы (“великолепно”, “плохо”, “очень вкусно” и др.), которые описывают отношение автора текста к некому объекту, а затем классифицирует их как средства выражения положительной, отрицательной или нейтральной оценки.
Однако определение лишь общей тональности текста не представляет особой практической пользы, поскольку пользователей интересуют нюансы и степень оценки, или степень тональности. Например, когда мы читаем отзывы посетителей кафе быстрого питания, мы легко улавливаем разницу между следующими двумя предложениями, которые выражают положительное отношение к продукту:
“Гамбургер был неплохой”
“Гамбургер был изумительный”
Мы понимаем, что в первом случае, несмотря на то, что посетитель кафе в целом удовлетворен качеством продукции, у него есть какой-то скрытый повод для недовольства, который нам еще предстоит выяснить. Автор второго отзыва, наоборот, абсолютно доволен продуктом.
Если бы перед компьютером стояла задача распределить отзывы на категории с положительной и отрицательной оценкой, он увидел бы в них лишь слова с положительной коннотацией, и следовательно, поместил бы оба отзыва в одну категорию. Для него оба отзыва были бы положительными. Компьютер не увидит между ними разницы, если не научить его это делать.
В ходе проведения опроса клиентов многие компании просят респондентов оценить свое отношение к их продуктам или услугам по шкале от “очень плохо” до “очень хорошо”. Представьте, как удобно было бы иметь возможность распределять по такой знакомой пятибалльной шкале текстовые отзывы покупателей, опубликованные в сети.
![]() | ![]() | ![]() | ![]() | ![]() |
В автоматизированном сентимент-анализе, подобно опросу клиентов, тональность также может быть рассчитана путем определения степени проявления положительной или отрицательной оценки в отдельных словах и фразах. Например, компьютер можно научить тому, что слово “изумительный” предполагает гораздо более положительную оценку гамбургера, чем слово “неплохой”, и степень положительной тональности первого слова гораздо выше. Механизм оценки степени отрицательной тональности работает аналогичным образом.
Если вы будете иметь возможность определять не только полярность, но и силу тональности оценочных слов и выражений, вам больше не придется тратить время и ресурсы компании на разработку сложных анкет для ваших клиентов для того, чтобы определить, кто из них очень доволен вашими продуктами и услугами, а кто — категорически недоволен. Вы сможете использовать данные онлайн-отзывов о продукции и данные социальных сетей для того, чтобы автоматизированно извлекать нужную информацию.
Почему важно уметь извлекать степень тональности?
Числовое представление степени тональности позволяет более детально визуализировать и моделировать ее. Примеры, представленные ниже, демонстрируют, как можно использовать данные о степени проявления тональности в процессе принятия бизнес-решений.
Отслеживание динамики степени удовлетворенности клиентов качеством товаров или услуг. Если измерять тональность отзывов по числовой шкале, полученные числовые значения можно использовать для анализа трендов. Например, если суммировать степени тональности разных слов, таких, как “неплохой” и “изумительный”, можно наглядно представить динамику в оценке продукта. На рисунке ниже показана динамика отрицательной и положительной оценки различных аспектов деятельности компании. Несложно заметить, что политика ценообразования (pricing) по мнению клиентов компании значительно улучшилась, в то время как качество продукции (quality) улучшилось незначительно.
Выявление полярных оценок. Важно иметь возможность определять, кто из участников опроса крайне отрицательно оценивает товар или услугу, а чье отношение более нейтральное. Например, пользователь может суммировать все тональности (и положительные, и отрицательные), и нанести их на GIS карту. На рисунке ниже изображена такая карта, где зеленым цветом обозначены все положительные отзывы по регионам, а красным — все отрицательные. Темно-красным цветом обозначены регионы, где преобладают крайне отрицательные отзывы, которые требуют принятия срочных мер по устранению недовольства со стороны клиентов. В нашем примере такими регионами являются Тунис и Индонезия. Благодаря такому анализу компания, проводившая опрос, получила наглядную картину того, как клиенты по всему миру оценивают такие аспекты ее деятельности, как ценовая политика, доступность продуктов, скорость реагирования на запросы клиентов и др. Эта информация позволила ей быстро принять адресные меры по устранению локальных проблем.
Выявление нейтральных оценок. На карте, представленной выше, есть несколько регионов, в которых преобладает нейтральная оценка товаров и услуг. Та категория клиентов, в отзывах которой преобладает нейтральная тональность, также представляет интерес для компании, поскольку изучение их мнения может помочь усовершенствовать товары или услуги. Например, судя по карте, в Бразилии преобладает нейтральная оценка товаров и услуг данной компании, и в этой ситуации для компании было бы полезно узнать, какие именно из ее товаров и услуг препятствуют созданию положительного образа бренда в данном регионе.