Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Произведения из школьной программы и развитие нейросетевой разметки: что нового появилось в НКРЯ

Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года.

  • Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного чтения.
  • Разработчики использовали нейросетевые модели для морфологической разметки всех текстов обучающего корпуса. Программа распознаёт и снимает грамматическую омонимию (когда словоформы разных слов совпадают друг с другом по написанию и звучанию — например, лечу больного и лечу на самолете). Это позволило добавить в обучающий корпус современные инструменты анализа слов и текстов.
  • При помощи новых инструментов можно составлять более разнообразные задания для школьников. Ученики смогут использовать их и для самостоятельной работы — например, чтобы написать реферат. А для преподавателей и студентов, готовых проводить более сложные исследования, добавлены новые виды выдачи результатов поиска (статистика, частотность, N-граммы) и новый вид поиска — поиск коллокаций. 

Кому и зачем нужен Национальный корпус русского языкаПолучить всю картотеку одним кликом и другие, менее очевидные возможности специальных корпусов

  • Мультимедийный корпус переведен на новый интерфейс. Теперь поиск по корпусу отображается в новом дизайне, доступны «Портреты слов». Особенность корпуса в том, что можно задать одновременно три поисковых запроса: для слов, жестов и речевых действий. По ним найдутся клипотексты, где и в видео/аудио, и в тексте встретились соответствия этим запросам: например, те, где в речи есть слово за, а в значении жеста — тост. Дополнительно можно задавать условия, описывающие вокалическую и орфоэпическую структуру слов.

Подробнее о новостях Национального корпуса русского языка можно узнать в телеграм-канале проекта. 

Портал «Грамота.ру»

все публикации

Чтобы хорошо учиться, детям нужно больше слов

Исследователи рекомендуют увеличивать словарный запас детей тремя способами


Чтение: практика, меняющая сознание

Пять книг о том, зачем мы читаем и как получить от этого занятия пользу и удовольствие


Вышел первый выпуск журнала «Русская речь» за 2024 год

«Фреш», «бишь» и научная терминология до Ломоносова 


Зоолог Арик Кершенбаум: «Мы все хотим знать, что говорят животные»

Интервью с автором новой книги о коммуникации в дикой природе


Чем нас привлекают искусственные языки

Их создание и изучение помогает лучше понять границы естественного языка


Вышла в свет книга археолога Стивена Митена «Загадка языка»

В ней утверждается, что язык возник примерно 1,6 млн лет назад


Право на имя

Когда выбор способа называть человека или группу людей становится проблемой


Между эмбрионом и покойником: где расположены роботы на шкале одушевленности

Каждый месяц мы выбираем и комментируем три вопроса, на которые ответила наша справочная служба


Как пришествие корпусов меняет лингвистику

Почему корпусная лингвистика не прижилась в 1960-х годах и почему переживает расцвет сейчас


Эвфемизмы: от суеверий до политкорректности

«Благозвучные» слова используют не только вместо ругательств



Критический взгляд на текст: как увидеть искажения и ловушки

Чтобы лучше понимать прочитанное, нужно развивать читательскую грамотность


Новые возможности восприятия книг: что лучше, буквы или звуки?

Слуховое чтение набирает популярность, но для него все равно нужны письменные тексты


«Давать» и «дарить»: какие слова можно считать однокоренными

Лингвист Борис Иомдин описывает два критерия, которыми могут пользоваться школьники


Как лингвисты проводят эксперименты: от интроспекции до Amazon

Какие инструменты они используют и где ищут участников, рассказывает «Системный Блокъ»


«Я хочу продолжать работать с текстами»

История незрячего редактора Иоланты, которая благодаря цифровым технологиям может заниматься тем, что нравится


Наследие Михаила Панова и судьбы русской орфографии

Статья Владимира Пахомова в журнале «Неофилология» помогает осмыслить проблемы русского правописания


Праздники грамотности

Как в мире проверяют знание правил родного языка


Научный стиль: точность не в ущерб понятности

Им пользуются авторы учебников, исследователи, лекторы, научные журналисты


Самый важный предмет. Функциональный подход к обучению русскому языку

Лекция Марии Лебедевой для Тотального диктанта о роли языка в учебе и в жизни