Толковый переводоведческий словарь - составление словаря словоформ
Составление словаря словоформ
в инженерной лингвистике происходит методом простого перебора введенного массива, отыскания идентичных словоформ и суммированию их количества, причем адресатом информации о форме служит сама словоформа. Из общего массива текста извлекается очередная словоформа, запоминается и организуется поиск очередных словоформ. Количество одинаковых словоформ суммируется. По окончании поиска найденные в тексте заданные формы исключаются из массива методом сдвига. Процесс чтения, запоминания и подсчета повторяется циклично до окончания обработки всего текста. После каждого цикла происходит сжатие (сдвиг) массива. В результате в памяти машины накапливается неранжированный список всех разных словоформ корпуса с их абсолютными частотами. Полученный список запоминается для последующего накопления или для ранжировки или может быть выведен на печать в виде каталога слов.
Толковый переводоведческий словарь. 3-е издание, переработанное. — М.: Флинта: Наука
Л.Л. Нелюбин
2003