Национальный корпус русского языка
| Национальный корпус русского языка | |
| URL: | |
|---|---|
| Коммерческий: |
нет |
| Тип сайта: |
образовательный/научный проект |
| Регистрация: |
Нет |
| Язык(и): |
русский/английский |
| Расположение сервера: | |
| Начало работы: | |
| Текущий статус: |
Работает |
Национа́льный ко́рпус ру́сского языка́ в общедоступный для поиска электронный онлайновый корпус русских текстов. Открыт 29 апреля 2004 года в Интернете по адресу http://ruscorpora.ru/.
Содержание |
[править] Составители
Работы по созданию Корпуса были начаты в 2001 году группой лингвистов из Москвы, Санкт-Петербурга, Воронежа и других городов.
В программе по созданию Национального корпуса русского языка участвуют специалисты следующих организаций[1]:
- Институт русского языка имени В. В. Виноградова (ИРЯ РАН)
- Институт языкознания РАН (ИЯз РАН)
- Институт проблем передачи информации им. А. А. Харкевича РАН (ИППИ РАН),
- Институт лингвистических исследований РАН (ИЛИ РАН) в Санкт-Петербурге (совместно с Санкт-Петербургским государственным университетом (СПбГУ)).
- Воронежский государственный университет.[2].
Сайт Корпуса и поиск по нему поддерживаются компанией «Яндекс», сотрудники которой принимали участие также в разработке программного обеспечения Корпуса. Доступ к ресурсам НКРЯ бесплатен.
[править] Состав корпуса
В Корпус входят как письменные тексты (художественные, мемуары, публицистика, научная, религиозная литература, повседневная печатная продукция), так и записи устных текстов (публичной речи и частных бесед).
В корпус также входят подкорпуса поэтических и диалектных текстов, корпуса параллельных текстов (для следующих языков доступны параллельные корпуса с русским: английский, немецкий, украинский, белорусский; размещены также 10 многоязычных текстов, переведённых на 10-20 языков каждый), отдельный газетный корпус (материалы СМИ начала XXI века), синтаксический, акцентологический, мультимедийный и обучающий подкорпуса. Объём основного корпуса на январь 2012 года составляет 209 млн словоупотреблений, а общий объем корпусов 364 млн словоупотреблений.
Тексты снабжены морфологической и семантической разметкой.
[править] См. также
[править] Примечания
[править] Литература
- Национальный корпус русского языка: 2003в2005. Сборник статей. М.: Индрик, 2005. ISBN 5-85759-358-1
- Национальный корпус русского языка : 2006в2008. Новые результаты и перспективы. / Отв. ред. В. А. Плунгян. в СПб.: Нестор-История, 2009. в 502 с. ISBN 978-5-98187-327-0
- Плунгян В.А. Зачем мы делаем Национальный корпус русского языка? // Отечественные записки. 2005. в„– 2.
[править] Ссылки
| Это заготовка статьи по лингвистике. Вы можете помочь проекту, исправив и дополнив её. |
| Это заготовка статьи о веб-сайте. Вы можете помочь проекту, исправив и дополнив её. |