Как зародился машинный перевод?

ТехИнсайдерHi-Tech

Как компьютеры научились переводить: от «языкового ковчега» до «электронного мозга»

cf83aa84b5c239d0da74565337d0827e_ce_1200x800x0x0.jpg

Каждый из нас хоть раз пользовался онлайн-переводчиком. Возможность в любое время дня и ночи даром переводить тексты, даже не зная иностранных языков, больше не кажется нам чудом. Но всего 70 лет назад никакого машинного перевода не было, а саму идею многие восприняли в штыки. Все изменилось 7 января 1954 года, когда Джорджтаунский университет и компания IBM продемонстрировали компьютер, умеющий переводить. Вспоминаем, как зародился машинный перевод вместе с сотрудником факультета компьютерных наук НИУ ВШЭ Антоном Басовым.

Машинный перевод… до машин

Перевод появился тогда же, когда появился язык. А машинный перевод? Должно быть, не раньше, чем были созданы компьютеры? И да, и нет. Машинный перевод действительно появился только вместе с компьютерами, но его предыстория начинается намного раньше.

История машинного перевода восходит к девятому веку, когда арабский ученый и «отец арабской философии» Аль-Кинди предложил взламывать шифры с помощью частотного анализа текста, то есть сравнивать частоту употребления букв в обычном языке с частотой употребления символов в шифровке. Так Аль-Кинди заложил основы криптографии, которая, как мы увидим дальше, неразрывно связана с машинным переводом.

Другим истоком машинного перевода стали работы по созданию универсального языка. В таком языке каждому слову соответствовало бы только одно понятие. В отличие от естественных языков, универсальный язык был бы лишен двусмысленностей, а поэтому недопонимание между людьми, говорящими на нем, было бы невозможно. Впервые идею такого языка выдвинул великий Рене Декарт.

Усилия по созданию универсального языка ни к чему не привели — все языки оказывались слишком сложными и недостаточно точными. Однако некоторые ученые пошли дальше и стали создавать системы, позволяющие общаться носителям разных языков. Такую систему описал в 1663 году ученый-иезуит Афанасий Кирхер. Он придумал ее после разговора с императором Священной Римской империи Фердинандом III. В империю входило множество стран с разными языками, поэтому межъязыковое общение играло важную роль.

В системе Кирхера каждому понятию соответствовал номер. В словаре под этим номером можно было найти слова пяти языков (латинского, французского, немецкого, итальянского и испанского), соответствующие данному понятию. Зная только один из этих языков, человек мог, пользуясь пронумерованным списком понятий, переводить текст на любой другой язык.Физическим воплощением системы стал «языковой ковчег» (Arca Glottotactica), в котором многоязычный словарь размещался на отдельных дощечках, которые можно было располагать в нужном порядке. Впрочем, ни система Кирхера, ни системы его современников Кейва Бека и Иоганна Бехера не снискали успеха — они были слишком несовершенны и недостаточно помогали процессу перевода.

22c23f3330294985869eb7b2bc4d300e.png
Языковой ковчег Афанасия Кирхера. Журнал Isis

Механические переводчики

Идея упрощения перевода с помощью механических устройств оказалась забыта вместе с идеей универсального языка — переводчики справлялись сами. Однако к 1930-м годам поток информации на разных языках стал увеличиваться. Благодаря телеграфу, телефону и радио информация распространялась быстрее. Распространение грамотности и увеличение выпуска журналов и газет привело к тому, что ее потребителей стало больше. И хотя переводчики все еще могли справиться сами, уже возникла идея механизации перевода.

К 1930-м годам техника проделала большой путь от «языкового ковчега» Кирхера. Появилась электротехника и электроника. Машины научились управлять дорожным движением, зажигать прожектора на аэродроме при приближении самолета, поддерживать курс корабля, печь хлеб и собирать автомобили. В распоряжении изобретателей оказались реле, моторы, радиолампы и фотоэлементы. И к 1935 году два изобретателя независимо друг от друга запатентовали механизмы для перевода.

Георгий (он же Жорж) Арцруни родился в Армении в 1893 году. Он изучал инженерию в Петрограде, а в 1922 году эмигрировал во Францию. С 1929 года он работал над машиной, которую называл «механический мозг» (cerveau mécanique). Это устройство предназначалось для хранения и поиска информации — сегодня мы бы назвали его поисковиком. Среди возможных применений своей машины Арцруни перечислял составление телефонных справочников и железнодорожных расписаний, печать билетов, шифрование — и перевод.

1671911d0b55bda5f99a96e0ee44776a.png
«Механический мозг» Георгия Арцруни. CafeTran

Памятью машины служила бумажная лента, на которой, как в системе Кирхера, записывались слова на разных языках. На одной строке находились слова, соответствующие одному понятию. Параллельно первой ленте шла вторая, на которой каждому понятию соответствовала определенная группа отверстий. Искомое слово вводилось в машину с помощью клавиатуры и кодировалось набором штырьков. Затем запускался мотор, и машина сравнивала наборы отверстий на второй ленте с расположением штырьков. Когда обнаруживалось совпадение, машина останавливалась, показывая в окошках слова с первой ленты.

Арцруни запатентовал свою машину в 1935 году. В 1937 году на всемирной выставке в Париже машина была отмечена дипломом. Несколько государственных ведомств — почта, железные дороги, министерство обороны — заключили с Арцруни контракты на разработку машин, однако Вторая мировая война и оккупация Франции помешали им осуществиться. Появление электронных компьютеров поставило крест на работе Арцруни — «механический мозг» проигрывал «электронному».

В том же 1935 году советский патент на «машину для подбора и печатания слов при переводе с одного языка на другой» получил Петр Смирнов-Троянский. Его судьба очень похожа на судьбу Арцруни — он родился в 1894 году, учился в Санкт-Петербургском университете; историки даже предполагают, что Смирнов-Троянский и Арцруни могли знать друг друга (хотя подтверждений этого нет). После революции Троянский учился в Институте красной профессуры, участвовал в составлении Большой советской и Технической энциклопедий.

Машина Троянского представляла собой наклонный стол, на котором располагалась уже привычная нам бумажная лента с многоязычным словарем. Перед столом находился фотоаппарат и пишущая машинка. Ленту со словарем вручную протягивали до нужного слова и фотографировали его. Одновременно — и в этом самое важное отличие машины Троянского от механического словаря Арцруни — на пишущей машинке печатали особые знаки, описывающие морфологические признаки слова (число, род и так далее).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Мозг просыпается постепенно, и волна активация идет ото лба к затылку Мозг просыпается постепенно, и волна активация идет ото лба к затылку

Чем процесс пробуждения отличается от процесса засыпания?

ТехИнсайдер
Пеле, Артемьев, Вествуд: нормально ли оплакивать знаменитостей? Пеле, Артемьев, Вествуд: нормально ли оплакивать знаменитостей?

Что думают психологи о скорби по знаменитостям?

Psychologies
Почему беспроводные наушники быстро разряжаются Почему беспроводные наушники быстро разряжаются

Причины, по которым беспроводные наушники быстро разряжаются

CHIP
С легким годом! С легким годом!

Каждый раз в новогоднюю ночь со всеми нами происходит что-то необычное

VOICE
Используй ложку и телефон: 20 способов доставить себе удовольствие Используй ложку и телефон: 20 способов доставить себе удовольствие

Двадцать разных способов мастурбации на любой вкус и цвет

Cosmopolitan
Уродцы в России: сколько и почему Петр I платил крестьянам за мутантов Уродцы в России: сколько и почему Петр I платил крестьянам за мутантов

Вот история отношений между фриками и правителем России

ТехИнсайдер
Пока свои не успокоятся Пока свои не успокоятся

«Вампиры средней полосы»: отечественные кровопийцы сходятся с реальностью

Weekend
Новый игрок крипторынка: повторит ли хедж-фонд российских мигрантов судьбу FTX Новый игрок крипторынка: повторит ли хедж-фонд российских мигрантов судьбу FTX

Wintermute стала одним из лидирующих маркетмейкеров в мире криптоактивов

Forbes
Пригодятся всем женщинам старше 45 лет: звездный парикмахер рассказал о своих принципах ухода за волосами Пригодятся всем женщинам старше 45 лет: звездный парикмахер рассказал о своих принципах ухода за волосами

Ларри работает парикмахером уже 17 лет, поэтому к его советам стоит прислушаться

VOICE
Пусть сначала подрастут Пусть сначала подрастут

Чтобы сбережений стало больше, неси их в банк: там деньги поработают на тебя

VOICE
Ученые надеются вырастить северного белого носорога из кусочка его кожи Ученые надеются вырастить северного белого носорога из кусочка его кожи

Ученые создали первичные зародышевые клетки из плюрипотентных стволовых клеток

ТехИнсайдер
20 лучших российских сериалов последних лет, которые должен посмотреть каждый 20 лучших российских сериалов последних лет, которые должен посмотреть каждый

Топ российских современных сериалов

Правила жизни
Психолог Адам Грант: все, что вы знаете о том, как продать себя и свою идею, неверно Психолог Адам Грант: все, что вы знаете о том, как продать себя и свою идею, неверно

Как достичь успеха? Методика психолога Адама Гранта

Inc.
Все, что вы хотели знать о похмелье, но боялись спросить Все, что вы хотели знать о похмелье, но боялись спросить

Что делать до, во время и после вечеринки, чтобы не было мучительно больно

Правила жизни
На чем ездили легендарные футболисты СССР На чем ездили легендарные футболисты СССР

Вопреки мифам и песням, автомобили советским спортсменам за победы не дарили

Maxim
Ценные кадры Ценные кадры

Куда же движется главное из искусств

Men Today
Иностранный Дед Мороз: как называют главного героя Нового года в разных странах Иностранный Дед Мороз: как называют главного героя Нового года в разных странах

Как выглядят коллеги Деда Мороза из других стран

ТехИнсайдер
Сколько можно пить. Наша новогодняя инструкция Сколько можно пить. Наша новогодняя инструкция

Сколько можно выпить и как научиться контролировать порции

Новый очаг
«18 — детский возраст»: психолог объясняет, почему это так «18 — детский возраст»: психолог объясняет, почему это так

В 18–20 лет мы кажемся себе взрослыми, но мозг еще далек от зрелости

Psychologies
Вначале было слово Вначале было слово

Ася Штейн — о том, чему мы можем поучиться у древних греков

Seasons of life
Правда ли нужно выпивать два литра воды в день? Ученые из Японии и США развенчали популярный миф Правда ли нужно выпивать два литра воды в день? Ученые из Японии и США развенчали популярный миф

Сколько нужно пить воды в день?

Inc.
Как агроном-самоучка вырастил из теплицы на даче семеноводческий комплекс Как агроном-самоучка вырастил из теплицы на даче семеноводческий комплекс

Василий Блокин-Мечталин вдохнул в подмосковную деревню Старое новую жизнь

Forbes
Криптозима, плесень в бургерах и нелетающие такси: 10 бизнес-провалов 2022 года Криптозима, плесень в бургерах и нелетающие такси: 10 бизнес-провалов 2022 года

Рассказываем про главные и самые громкие бизнес-провалы 2022 года

Forbes
5 ученых, ставших писателями-фантастами 5 ученых, ставших писателями-фантастами

Часто ли научная фантастика пересекается с реальной наукой?

Maxim
В СССР он был вкуснее, его делали «из дичи» и еще 5 удивительных фактов о майонезе В СССР он был вкуснее, его делали «из дичи» и еще 5 удивительных фактов о майонезе

В XIX веке майонез был не только соусом, но и семейством самостоятельных блюд

Maxim
Что важно для успешной карьеры: 5 ключевых качеств — рекомендации коуча Что важно для успешной карьеры: 5 ключевых качеств — рекомендации коуча

Какие качества помогут построить успешную карьеру?

Psychologies
«Накануне Рождества»: святочный рассказ о вдове и ее детях «Накануне Рождества»: святочный рассказ о вдове и ее детях

Отрывок из книги Елены Душечкиной «Русский святочный рассказ»

Forbes
Насколько быстро бегает гепард: сможет ли гончая его обогнать? Насколько быстро бегает гепард: сможет ли гончая его обогнать?

Насколько гепарды быстры и что позволяет им развивать такую скорость?

ТехИнсайдер
Как избавиться от телефонного спама и звонков мошенников Как избавиться от телефонного спама и звонков мошенников

Сейчас мы разберемся, как максимально эффективно избавиться от телефонного спама

CHIP
6 признаков грядущего развода: проверьте ваши отношения 6 признаков грядущего развода: проверьте ваши отношения

Как правильно поговорить с партнером и расставить все точки над i?

Psychologies
Открыть в приложении