Воскресенье, 14 Июля 2024
Почему я хочу создать ии модель, которая может говорить на всех языках мира?
Я хочу чтобы понятие языковой барьер
было понятием из прошлого. Тут два пути как это сделать: сделать так чтобы все говорили на одном языке, или сделать супер крутой переводчик, который переводил бы невероятно хорошо.
И путь с переводчиком - мой путь.
Буду делать переводчик. Усный, письменный и визуальный. Тот который переводит со всех языков мира на все. Тот который переводит в режиме реального времени, сохраняя все атрибуты речи говорящего человека, тембр голоса, манеру речи. Тот который стирает языковой барьер
Например, есть фильм на английском. Переводчик должен перевести его на русский сохранив все голоса актеров, сохранив смысл сказанного максимально близко передав, включая игру слов. Главное тут - это перевод аудио. Дуюляж с сохранением всех черт оригинала.
Или доступ к работе. Должно быть возможно, чтобы человек из Японии, Китая, России, Франции, Германии, Англии, Египта сели за один стол и начали беседу, например об каком-нибудь физическом явлении, работе в ЦЕРНе, каждый на своем родном языке, но ход общения был настолько плавный и результативный, как будто все они разговаривают на одном языке.
Немного предисловия как я дашел до такой цели. Языки я учу давно и знаю несколько довольно неплохо. Знаю английский, русский, польский, беларуский. Учу французский. В какой-то момент я осознал, что сколько бы я не учил языков, выучить их на том же уровне как и русский мне не удастся. Учение языка дело очень сложное, оно требует ежедневного подхода, в каком то смысле изучении языка людьми и обчение нейросети очень похожа. И там и там требуется очень большое количество данных. В случае с языком, чтобы изучить на хорошем уровне нужно простотреть тысячи часов видео, тысячи часов аудио, тысячи страниц книг, статей, заметок. Но этот уровень все равно не будет таким же как у родного языка. Можно начать учить языки из разных семей, чтобы увеличить количество языков которые ты можешь понять, но все равно изучить даже 15-20 языков на уровне носителя языка невыполнимая задача. Не говоря уже про 500-600 языков. Единственный хороший выход это изучить один язык как можно лучше, как бы вобрав понятия других языков в свой, при этом сохранив структуру и слова своего языка. И сделать невероятно хороший переводчик. Это не только упростит все, но также обогатит все языки, и откроет новые возможности для людей, живущих с таким переводчиком.