Очистка неструктурированных данных
Очистка данных играет важную роль в ходе их анализа. От эффективности очистки данных во многом зависит точность моделей и конечные выводы, к которым приходит исследователь. В реальной практике очистка данных составляет 50-80% аналитического процесса. Традиционные методы очистки данных главным образом используются для обработки структурированных данных и предполагают восстановление отсутствующих значений, изменение формата данных и исправление содержательных ошибок, а также удаление ненужных данных. Информации о таких методах работы с данными много.…