Кажется, Яндекс всерьез проникся упреками в адрес своего морфологичекого анализатора: теперь они решили его обновить.
Напомним, что одна из задач компьютерной лингвистики - определение словарной формы слова. Т.е., например, если пользователь вводит в поисковой строке словосочетание «лечение грибами», то поиск отработает это в самых разных словоформах. Для решения этой задачи в 2006 году Яндекс морфологический анализатор русского языка в виде небольшой консольной программы, которая производит морфологический анализ слов, причем и тех, которые словарю известны, так и тех, которые неизвестны.
Теперь в новую версию программы внесено много улучшений и изменений. В первую очередь изменения коснулись интерфейса и словаря, а алгоритмы и принципы работы остались нетронутыми.
Сам словарь увеличился практически вдвое. Поскольку словарный запас увеличился, разбор текста будет иным, нежели в старой версии.
Что касается интерфейса, то в него добавлена поддержка различных кодировок.
Читайте также
Последние новости