ресурсы в сети
|
| |
Русская виртуальная библиотека
http://rvb.ru/soft/catalogue/catalogue.html-
Каталог лингвистических программ и ресурсов в Cети
Данный каталог включает в себя описание программ, связанных с анализом текстов и вычислительной лингвистикой, а также соответствующих ресурсов, доступных сегодня в глобальной сети Интернет. Упор при составлении каталога делался на бесплатные программы, доступные для загрузки. Однако также описаны некоторые on-line и коммерческие версии программ. Тематически каталог разбит на следующие разделы:
- программы анализа и лингвистической обработки текстов;
- программы преобразования текстов;
- психолингвистические программы;
- генераторы текстов и "говорящие" программы;
- системы обработки естественного языка;
- коллекции ресурсов;
- словари и тезаурусы.
Автоматическая Обработка Текста
www.aot.ru - рабочая группа молодых специалистов, разрабатывающих программное обеспечение в области автоматической обработки текста. В круг наших интересов в основном входит анализ русского языка.
Наш подход скорее можно назвать консервативным, чем революционным. Мы не верим ни в какую общую суперидею, объясняющую сущность естественного языка. Вместе с тем мы считаем, что только грамотная декомпиляция языковых механизмов позволит максимально приблизить человеческий язык к современному компьютеру.
- Графематика
- Морфология
- Работа с морф. словорями
- Постморфология
- Синтаксис
- Семантика
- Автоматическая Обработка Текста
Морфология
Пользователь вводит русскую, английскую или немецкую словоформу и получает нормальную форму и морфологические атрибуты либо, по желанию, всю парадигму слова.
Синтаксис
Пользователь вводит предложение на русском языке и получает результаты анализа поверхностного синтаксиса в виде системы составляющих
Граф
По одному предложению на русском языке строится поверхностно семантический граф.
Перевод
Перевод с русского языка на английский. Используются результаты графематического, морфологического и синтаксического анализаторов.
Поиск по массиву
Лингвистический поиск по размеченному синтаксическим анализатором массиву. Можно искать по части речи и по морф. характеристикам. Размеченный корпус состоит из 50 миллионов слов.
ИНСТИТУТ РУССКОГО ЯЗЫКА
имени В. В. ВИНОГРАДОВА
РОССИЙСКОЙ АКАДЕМИИ НАУК
и ИЗДАТЕЛЬСТВО "АЗБУКОВНИК"
http://www.slovari.ru/ - Русские словари. Служба русского языка.
|
|