Анализ тональности – термин, который сегодня у всех на слуху, однако далеко не все до конца понимают этот класс методов анализа данных и как его использовать. Применение инструментов сентимент-анализа в бизнесе дает преимущества не только компаниям, но и их клиентам, поскольку позволяет усовершенствовать товары и услуги, выявлять сильные и слабые стороны товаров конкурентов, а также создавать таргетированную рекламу.
Анализ тональности текстов (анг. Sentiment Analysis, Sentiment Detection или Opinion Mining) – определение полярности эмоциональных оценок в исследуемом тексте, который содержит мнения, суждения, эмоции, отношение автора к сущностям, личностям, вопросам, событиям, темам и их атрибутам1. Выражаясь простым языком, анализ тональности отвечает на вопрос “Как автор текста относится к данной теме?”. При этом отношение автора может быть положительным, отрицательным или нейтральным.
В ходе анализа тональности в тексте выявляются слова и выражения, которые имеют положительную, отрицательную или нейтральную окраску. Люди распознают тональность того или иного текста не только на основе лингвистических знаний, но и исходя из социального контекста. Компьютеры научились легко распознавать языковые модели, но если интерпретация тональности текста сильно зависит от контекста, точность такого анализа, выполненного машиной, пока не гарантирована. Например, человек сразу поймет, что слово дешевый в описании цены означает положительную оценку товара, но при описании качества это слово используется в отрицательном значении. Также бывают случаи, когда в текстах одного домена какое-либо слово констатирует факт, а текстах другого – выражает эмоциональную оценку. Прилагательное красный в отзыве об отеле (“на стене висела картина с красными цветами”) всего лишь констатирует факт, в то время как в жалобе о работе принтера “рисунок распечатался в красном цвете” оно означает неисправность и выражает отрицательную тональность. В связи с этим компьютеры необходимо обучать тому, чтобы они могли учитывать контекст слов и выражений, и правильно определять тональность текстов. Так, например, все современные инструменты анализа тональности текста уже умеют работать с текстами разной тематики, или с текстами конкретного домена.
Степени тональности
Кроме полярности, в анализе текста нас также интересует и степень тональности, т.е. нам важно знать, насколько отрицательно или насколько положительно оценивается тот или иной товар или услуга. Некоторые слова и фразы выражают сильные эмоции. Например, предложение “фильм оказался не так уж плох” содержит менее выраженную отрицательную оценку по сравнению с фразой “фильм был ужасный”. Возможность определять степень выраженности той или иной тональности в текстах отзывов имеет большое значение в процессе принятия решений и позволяет повысить их эффективность.
Типы тональности
В сентимент-анализе нас также интересует тип тональности: радость, грусть, отвращение, разочарование, страх, тревога, надежда и др. Например, в предложении “Я рассчитывал, что скачивание будет выполняться быстрее” не только очевидна отрицательная тональность, но и разочарование. Другой пример “Я переживаю, что в следующей серии фильма Мстители не будет моего любимого супергероя” имеет отрицательную тональность и выражает обеспокоенность. И наоборот, в предложении “Жду не дождусь своего нового iPhone!” присутствует положительная тональность и выражена надежда.
Где применяется анализ тональности текстов?
С появлением социальных сетей сентимент-анализ стал основной методикой, которая используется для выявления отношения клиентов к товаром и услугам. Эту методику уже давно применяют для анализа ответов на вопросы открытого типа. Однако такие данные сложно собирать, и их обычно немного, в отличие от тех отзывов, которые миллионы пользователей добровольно публикуют в социальных сетях. Эти данные, которые находятся в свободном доступе в сети, также могут быть обработаны инструментами сентимент-анализа и использованы в бизнес-аналитике.
Отзывы, публикуемые на сайтах, форумах и в соцсетях позволяют выявлять достоинства и недостатки товаров и услуг. Эту информацию компании используют для того, чтобы усовершенствовать свою продукцию. Вы сможете представить себе все преимущества анализа тональности текстов, когда поймете, что он дает возможность резюмировать содержание миллионов пользовательских отзывов о “качестве продукции” в режиме реального времени. Рассмотрим следующий отзыв:
Его автор делится своим мнением о недавно приобретенном принтере. Покупатель в целом доволен товаром. Его устраивает качество печати, многофункциональность устройства и цена. Благодаря тому, что используемый инструмент анализа тональности текста позволяет учитывать тематику отзыва (домен), удалось выяснить, что единственное, что вызывает отрицательные эмоции у клиента – размер принтера.
Конкурентная разведка
Для успешного ведения бизнеса важно не только видеть достоинства и недостатки собственных товаров и услуг глазами клиентов компании, но и понимать, как обстоят дела у конкурентов. Например, компании могут изменить некоторые характеристики своих товаров, если конкурентная разведка выяснит, что клиентам конкурирующих компаний такие характеристики приходятся по вкусу. Отрицательное отношение клиентов конкурентов к их продукции также может повлиять на процесс приема стратегических решений. В отзыве, представленном ниже, один принтер сравнивается с другим (Printer X), созданным конкурирующей компанией. Автор отзыва говорит о том, что первый принтер легко настраивается, у него удобный интерфейс и он легко находит сеть wi-fi, но принтер конкурентов имеет одно значимое преимущество – у него организована задняя подача бумаги из лотка.
Исследование рынка
Если торговая организация занимается продажей товаров и услуг других компаний, ей важно знать, что покупателям нравится, а что можно и нужно улучшить. Такая информация позволит продавцу решить, продажу какой продукции или услуг следует продолжать, и что требует продвижения на рынке. И наоборот, если одна компания продает свои продукты через другие компании, она может проанализировать отзывы покупателей, чтобы выявить недостатки отдельных продавцов или найти новых дилеров. Например, в следующем твите отрицательные эмоции по отношению к рекламе товаров одного бренда могут свидетельствовать о потенциальном сокращении продаж, и такая информация может быть полезна компании, продающей товары этого бренда.
А вот еще одна публикация в Твиттере:
Покупатель недоволен ассортиментом чернил для принтера одного бренда в конкретном магазине; если представители бренда не обратят внимание на проблему, это может привести к снижению продаж.
Реклама
Современная реклама часто использует отзывы покупателей для продвижения товаров или услуг. Анализ тональности позволяет компаниям выявлять положительные отзывы своих покупателей, которые можно использовать в рекламных целях и для того, чтобы показать, что их продукции можно доверять. Кроме того, полученные данные можно использовать для того, чтобы выгодно представлять свои товары и услуги относительно аналогичной продукции конкурентов путем выявления недостатков, описанных покупателями конкурирующих компаний. Например, американская компания Gusto в рекламных целях публикует в своем аккаунте Твиттер и на корпоративном сайте положительные отзывы клиентов о своих инструментах создания финансовой отчетности.