Следующая новость
Предыдущая новость

Новый морфологический поиск в Яндексе

Кажется, Яндекс всерьез проникся упреками в адрес своего морфологичекого анализатора: теперь они решили его обновить.

Напомним, что одна из задач компьютерной лингвистики — определение словарной формы слова. Т.е., например, если пользователь вводит в поисковой строке словосочетание «лечение грибами», то поиск отработает это в самых разных словоформах. Для решения этой задачи в 2006 году Яндекс морфологический анализатор русского языка в виде небольшой консольной программы, которая производит морфологический анализ слов, причем и тех, которые словарю известны, так и тех, которые неизвестны.

Теперь в новую версию программы внесено много улучшений и изменений. В первую очередь изменения коснулись интерфейса и словаря, а алгоритмы и принципы работы остались нетронутыми.

Сам словарь увеличился практически вдвое. Поскольку словарный запас увеличился, разбор текста будет иным, нежели в старой версии.

Что касается интерфейса, то в него добавлена поддержка различных кодировок.

Последние новости