Сможет ли искусственный интеллект заменить переводчиков? Сообщения СМИ, аргументы в пользу и против прогноза.
04 февраля 2021 - Почему эти алгоритмы не используются повсеместно? Обучение алгоритма T5 с помощью облачных вычислений обойдется примерно в $1,3 млн. К счастью, исследователи из Google были достаточно любезны, чтобы поделиться этими моделями. Но эти модели нельзя использовать для чего-то конкретного, не настроив их на конкретную задачу. Так что даже это будет дорого стоить. И как только вы оптимизировали эти модели для вашей конкретной задачи, они по-прежнему требуют больших вычислительных мощностей и длительного времени для выполнения. Со временем, по мере того как компании инвестируют в тонкую настройку, будут появляться приложения с ограниченными возможностями. И, если мы доверяем Закону Мура, мы могли бы увидеть более сложные приложения примерно через пять лет. Но появятся и новые модели, которые превзойдут алгоритм Т5. https://rb.ru/story/yazykovye-sistemy/
15 января 2021 - Искусственный интеллект (ИИ) DeBERTa корпорации Microsoft превзошел возможности человека бенчмарке SuperGLUE – тесте на понимание естественного языка. Как сообщили CNews представители Microsoft, он набрал 90,3 балла, тогда как показатели человека находятся на уровне 89,8 балла. Другими словами, отрыв небольшой, но все же он есть. DeBERTa (Decoding-enhanced BERT with disentangled attention) – это алгоритм понимания естественного языка (Natural Language Understanding, NLU), созданный Microsoft. Тест SuperGLUE состоит из восьми задач, связанных с пониманием структуры текста, а также его контекста и причинно-следственных связей в нем. При его прохождении DeBERTa (Decoding-enhanced BERT with disentangled attention), помимо прочего, приходилось давать ответы на вопросы по «прочитанному» им абзацу, а также уточнять, правильно ли использовалось то или иное слово, для которого в языке предусмотрено несколько значений, в конкретном контексте. https://www.cnews.ru/news/top/2021-01-15_iskusstvennyj_intellekt
21 февраля 2019 - 14 февраля некоммерческая исследовательская компания OpenAI выпустила новую языковую модель, способную генерировать убедительные отрывки текста. Настолько убедительные, что создатели решили не выкладывать полный код в открытый доступ: он мог бы стать инструментом для создания ложных новостей. Несмотря на впечатляющие результаты, методы OpenAI не новы, и в первую очередь прорыв был обеспечен огромным количеством обучающих данных. Тексты, созданные программой, вполне могут сойти за написанное человеком. Однако эту способность не стоит путать с подлинным пониманием языка — конечной целью учёных, занимающихся обработкой естественных языков. (В компьютерном зрении происходит то же самое — алгоритмы умеют синтезировать реалистичные изображения, совершенно не понимая зрительных образов.) «Вероятно, существует качественный разрыв между пониманием языка, восприятием мира человеком и современными моделями», — отмечает профессор информатики в Стэнфорде Перси Лян. Преодоление этого разрыва потребует нового мышления, добавляет он, и гораздо больше времени. https://vc.ru/dev/59105-pochemu-kompyuter-mozhet-pisat-kak-chelovek-no-p...
16 сентября 2018 - Гендиректор ЦРТ (Центра речевых технологий) Дмитрий Дырмовский: "Акустическое моделирование — одна из самых сложных вещей в распознавании речи. То, как звучит тот или иной звук, зависит не только от говорящего, но и от канала — говорите вы по телефону или записываетесь на диктофон — и акустические модели тут применяются разные. Языковая модель статистически предсказывает, какое слово прозвучало исходя из контекста, частотности и сочетаемости слов. Она зависит от того, на каком языке говорят, какой словарь используется: общий, юридический, медицинский и т. д. Например, формат интервью намного проще для распознавания, чем обычный разговор по телефону между друзьями. В разговоре очень много контекста: сокращений, «своих» слов, которые мы не понимаем, но знают оба собеседника, так как они находятся внутри одного контекста. Система распознавания (и автоматизированный переводчик) не знает этого контекста. Используя семантику, нейронная сеть строит гипотезы, чтобы точнее определить, что за слово было произнесено, какое применить окончание. Ведь даже при обычном разговоре вы улавливаете только 95% произнесенных слов — остальное домысливаете исходя из контекста, так устроен человеческий мозг. Машине важно находиться в контексте, если его нет, остальное будет распознано неправильно. К тому же не стоит забывать про учет контекста для понимания сказанного. Тем же голосовым помощникам на основе искусственного интеллекта нужно понимать юмор, иронию, сарказм для того, чтобы точно и продуктивно вести диалог с живым человеком. В этом плане распознавать речь сложнее, чем изображения.
15 марта 2018 - Идеальный сценарий для машинного обучения и искусственного интеллекта будет заключаться в фиксированных правилах и четких критериях успеха или неудачи. Шахматы — очевидный пример. В переводе не существует четких и выверенных правил. Непонятно, как говорить машине, что она делает правильно, а что нет. Обозначить в языке информационные ярлыки принципиально сложно, иногда два переводчика не могут договориться о правильности перевода. Также, значение отдельного слова зависит от остальной части предложения, значение предложения зависит от остальной части параграфа и текста в целом, а значение текста зависит от культуры, намерений говорящего и прочего. Сарказм и ирония, например, имеют смысл только в широком контексте. Идиомы также могут быть проблемными для автоматизированного перевода. Переводить — это по сути интерпретировать, не просто идею, но и чувство. Человеческие чувства и идеи, которые могут понять только люди — а иногда даже мы, люди, не можем понять других людей. Самая большая проблема машинного перевода на сегодня состоит в том, что мы склонны переходить от синтаксической формы предложения на языке ввода к синтаксической форме этого предложения на целевом языке. Мы, люди, так не делаем. Мы сперва расшифровываем значение предложения на входном языке, а затем кодируем это значение на целевом языке. https://hi-news.ru/computers/pochemu-ii-do-six-por-ne-ovladel-perevodom-...
17 января 2018 - Искусственный интеллект-переводчик может появиться на рынке через десять лет, что решит проблему доступности учебных материалов на других языках, считает ректор НИУ ВШЭ Ярослав Кузьминов.
14 сентября 2017 - Специалисты "Яндекса" создали новую систему онлайн-перевода, которая одновременно использует и старые статистические алгоритмы, и искусственный интеллект, сообщает пресс-служба компании. Пока новая система поддерживает только перевод с английского на русский язык. При использовании искусственного разума для перевода с одного языка на другой, нейросеть "читает" переводимый текст, то она не пытается перевести его по фразам или отдельным словам, а ищет ответ целиком, используя данные, накопленные при анализе текстов, переведенных человеком. У подобного подхода, как отмечают специалисты "Яндекса", есть как плюсы, так и минусы: в таком виде текст становится более читаемым и похожим на то, как его перевел бы человек, но, с другой стороны, машина периодически начинает "фантазировать", если ей встречаются редкие слова и фразы. Эту проблему "Яндекс" решил, объединив искусственный разум со старой системой перевода, хорошо справлявшейся с редкими словами, но сталкивавшейся с большими проблемами при их объединении в предложения. Когда пользователь вводит текст, его одновременно переводит и нейросеть, и статистический алгоритм, после чего система машинного обучения CatBoost, недавно созданная "Яндексом", сопоставляет результаты и собирает из них более читаемый и грамотный вариант. В марте компания Google запустила в Google Translate технологию машинного перевода на базе нейросетей для русского языка. Нейросети переводят целые предложения. Раньше переводчик Google переводил предложения по частям, что ухудшало качества перевода.
Результаты поиска прогнозов по запросам: "Перевод", "Язык"
О проекте "википедии будущего"
Пополняйте "википедию будущего": добавляйте сообщения СМИ по теме прогноза! Не забудьте ссылку на источник.