Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Михаил Копотев о роли сгенерированных нейросетью текстов...
...Нейросети учатся на текстах, созданных человеком. Но...
...Чат-боты GPT и другие: что думают лингвисты о больших языковых моделяхВпереди демократизация порождения текстов и большие риски злоупотребленийЧем больше данных и чем стандартнее жанр, тем лучше работают модели. Перевод инструкций для бытовой техники — хороший пример такого рода....
...Обучение и самообучение: как синтетические данные влияют...
Инструкции, законы, юридические договоры, профессиональные статьи чаще всего написаны специфическим языком. Хотя мы принимаем это как должное, исследования показывают: такая практика вредит экономике и обществу в целом.
...Неудачные формулировки дорого обходятся...
...Инструкции, законы, юридические договоры, профессиональные...
...Чем понятнее, тем лучше Использование понятного языка (в том числе в юридической сфере, в бизнес-среде, в государственных коммуникациях и даже личных блогах) дает несколько преимуществ. 1. Меньше ошибок, которые дорого обходятся....
...Почему писать хорошие тексты выгодно...