В эпоху глобализации данные, с которыми мы имеем дело, часто имеют глобальный характер. Специалист по анализу данных даже в самой небольшой компании сегодня часто сталкивается с необходимостью обработки текстовых данных на нескольких языках. Что делать в подобной ситуации?
Вы можете выбрать один из двух подходов: машинный перевод иноязычных текстов или анализ текстов на языке оригинала.
- Первый подход предполагает создание копии таблицы данных, в которой все тексты переведены на один язык, и последующий анализ этой таблицы. При этом сам процесс анализа данных упрощается, поскольку для его выполнения вам понадобится только один языковой модуль.
- При втором подходе документы на языках оригинала анализируются с помощью нескольких соответствующих языковых модулей.