Векторизация текста на основе ГРНТИ
Для заданного текста на основе ключевых слов алгоритм строит вектор оценок – тематический профиль. Тематический профиль показывает, насколько данный текст близок к каждой из тем профиля. В основу тематического профиля положен универсальный классификатор ГРНТИ.

На основе сравнения векторов можно делать выводы о тематической близости текстов.

На рисунке представлено сравнение предсказанных нашим алгоритмом категорий ГРНТИ и реальных категорий текстов в виде матрицы ошибок.

Руководитель: Максим Хлопотов
Разработчик: Юлия Соломонова, solomonovajulia@gmail.com