Патент №2517368 - Способ и устройство определения и оценки значимости слов

Изобретение относится к методам обработки информации. Техническим результатом является повышение точности определения важности слов в классифицированных данных большого объема. В предлагаемом способе вычисляют Документную Частоту (ДЧ) слова в классифицированных данных. Затем выполняют одноаспектные оценки слова согласно ДЧ. После чего выполняют многоаспектную оценку слова по результатам одноаспектных оценок для получения весового коэффициента важности слова. Причем перед вычислением ДЧ в классифицированных данных предварительно выполняют обработку указанного слова и (или) после получения коэффициента важности определяют значимость слова согласно его коэффициенту важности. При определении значимости слова по его коэффициенту важности задают пороговое значение важности и пороговое значение постоянного использования для каждого уровня. Определяют значимость слова на уровне согласно отношению между двумя пороговыми значениями и коэффициентом важности. Выполняют нормализацию коэффициента важности на каждом уровне для получения комплексного весового коэффициента. На основе комплексного коэффициента выполняют комплексную классификацию значимости для слов одинаковой значимости на разных уровнях. 4 н. и 20 з.п. ф-лы, 5 ил.

Патент №2517368, изображение 1
Патент №2517368, изображение 2
Патент №2517368, изображение 3

Классификация патента

Код Наименование
МПК G06F 17/30Устройства или методы цифровых вычислений или обработки данных, специально предназначенные для специфических функций - информационный поиск; структуры баз данных для этой цели