Как зародился машинный перевод?

ТехИнсайдерHi-Tech

Как компьютеры научились переводить: от «языкового ковчега» до «электронного мозга»

cf83aa84b5c239d0da74565337d0827e_ce_1200x800x0x0.jpg

Каждый из нас хоть раз пользовался онлайн-переводчиком. Возможность в любое время дня и ночи даром переводить тексты, даже не зная иностранных языков, больше не кажется нам чудом. Но всего 70 лет назад никакого машинного перевода не было, а саму идею многие восприняли в штыки. Все изменилось 7 января 1954 года, когда Джорджтаунский университет и компания IBM продемонстрировали компьютер, умеющий переводить. Вспоминаем, как зародился машинный перевод вместе с сотрудником факультета компьютерных наук НИУ ВШЭ Антоном Басовым.

Машинный перевод… до машин

Перевод появился тогда же, когда появился язык. А машинный перевод? Должно быть, не раньше, чем были созданы компьютеры? И да, и нет. Машинный перевод действительно появился только вместе с компьютерами, но его предыстория начинается намного раньше.

История машинного перевода восходит к девятому веку, когда арабский ученый и «отец арабской философии» Аль-Кинди предложил взламывать шифры с помощью частотного анализа текста, то есть сравнивать частоту употребления букв в обычном языке с частотой употребления символов в шифровке. Так Аль-Кинди заложил основы криптографии, которая, как мы увидим дальше, неразрывно связана с машинным переводом.

Другим истоком машинного перевода стали работы по созданию универсального языка. В таком языке каждому слову соответствовало бы только одно понятие. В отличие от естественных языков, универсальный язык был бы лишен двусмысленностей, а поэтому недопонимание между людьми, говорящими на нем, было бы невозможно. Впервые идею такого языка выдвинул великий Рене Декарт.

Усилия по созданию универсального языка ни к чему не привели — все языки оказывались слишком сложными и недостаточно точными. Однако некоторые ученые пошли дальше и стали создавать системы, позволяющие общаться носителям разных языков. Такую систему описал в 1663 году ученый-иезуит Афанасий Кирхер. Он придумал ее после разговора с императором Священной Римской империи Фердинандом III. В империю входило множество стран с разными языками, поэтому межъязыковое общение играло важную роль.

В системе Кирхера каждому понятию соответствовал номер. В словаре под этим номером можно было найти слова пяти языков (латинского, французского, немецкого, итальянского и испанского), соответствующие данному понятию. Зная только один из этих языков, человек мог, пользуясь пронумерованным списком понятий, переводить текст на любой другой язык.Физическим воплощением системы стал «языковой ковчег» (Arca Glottotactica), в котором многоязычный словарь размещался на отдельных дощечках, которые можно было располагать в нужном порядке. Впрочем, ни система Кирхера, ни системы его современников Кейва Бека и Иоганна Бехера не снискали успеха — они были слишком несовершенны и недостаточно помогали процессу перевода.

22c23f3330294985869eb7b2bc4d300e.png
Языковой ковчег Афанасия Кирхера. Журнал Isis

Механические переводчики

Идея упрощения перевода с помощью механических устройств оказалась забыта вместе с идеей универсального языка — переводчики справлялись сами. Однако к 1930-м годам поток информации на разных языках стал увеличиваться. Благодаря телеграфу, телефону и радио информация распространялась быстрее. Распространение грамотности и увеличение выпуска журналов и газет привело к тому, что ее потребителей стало больше. И хотя переводчики все еще могли справиться сами, уже возникла идея механизации перевода.

К 1930-м годам техника проделала большой путь от «языкового ковчега» Кирхера. Появилась электротехника и электроника. Машины научились управлять дорожным движением, зажигать прожектора на аэродроме при приближении самолета, поддерживать курс корабля, печь хлеб и собирать автомобили. В распоряжении изобретателей оказались реле, моторы, радиолампы и фотоэлементы. И к 1935 году два изобретателя независимо друг от друга запатентовали механизмы для перевода.

Георгий (он же Жорж) Арцруни родился в Армении в 1893 году. Он изучал инженерию в Петрограде, а в 1922 году эмигрировал во Францию. С 1929 года он работал над машиной, которую называл «механический мозг» (cerveau mécanique). Это устройство предназначалось для хранения и поиска информации — сегодня мы бы назвали его поисковиком. Среди возможных применений своей машины Арцруни перечислял составление телефонных справочников и железнодорожных расписаний, печать билетов, шифрование — и перевод.

1671911d0b55bda5f99a96e0ee44776a.png
«Механический мозг» Георгия Арцруни. CafeTran

Памятью машины служила бумажная лента, на которой, как в системе Кирхера, записывались слова на разных языках. На одной строке находились слова, соответствующие одному понятию. Параллельно первой ленте шла вторая, на которой каждому понятию соответствовала определенная группа отверстий. Искомое слово вводилось в машину с помощью клавиатуры и кодировалось набором штырьков. Затем запускался мотор, и машина сравнивала наборы отверстий на второй ленте с расположением штырьков. Когда обнаруживалось совпадение, машина останавливалась, показывая в окошках слова с первой ленты.

Арцруни запатентовал свою машину в 1935 году. В 1937 году на всемирной выставке в Париже машина была отмечена дипломом. Несколько государственных ведомств — почта, железные дороги, министерство обороны — заключили с Арцруни контракты на разработку машин, однако Вторая мировая война и оккупация Франции помешали им осуществиться. Появление электронных компьютеров поставило крест на работе Арцруни — «механический мозг» проигрывал «электронному».

В том же 1935 году советский патент на «машину для подбора и печатания слов при переводе с одного языка на другой» получил Петр Смирнов-Троянский. Его судьба очень похожа на судьбу Арцруни — он родился в 1894 году, учился в Санкт-Петербургском университете; историки даже предполагают, что Смирнов-Троянский и Арцруни могли знать друг друга (хотя подтверждений этого нет). После революции Троянский учился в Институте красной профессуры, участвовал в составлении Большой советской и Технической энциклопедий.

Машина Троянского представляла собой наклонный стол, на котором располагалась уже привычная нам бумажная лента с многоязычным словарем. Перед столом находился фотоаппарат и пишущая машинка. Ленту со словарем вручную протягивали до нужного слова и фотографировали его. Одновременно — и в этом самое важное отличие машины Троянского от механического словаря Арцруни — на пишущей машинке печатали особые знаки, описывающие морфологические признаки слова (число, род и так далее).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему ученые до сих пор не могут предсказывать землетрясения Почему ученые до сих пор не могут предсказывать землетрясения

Почему землетрясения не поддаются прогнозированию?

ТехИнсайдер
Как сделать правильный выбор: 5 шагов к верному решению — советы экспертов Как сделать правильный выбор: 5 шагов к верному решению — советы экспертов

Упражнения, которые помогут найти путь к хорошему выбору — чего бы он ни касался

Psychologies
Информационная безопасность: десять основных видов хакерских атак Информационная безопасность: десять основных видов хакерских атак

Отрывок из книги Антона Евгеньева «Ценность ваших решений»

Forbes
Почему мы забываем плохое Почему мы забываем плохое

Ученые и врачи рассказывают, почему и как «время лечит»

Maxim
Два месяца под землей без света и общения с людьми: эксперимент Мишеля Сифра Два месяца под землей без света и общения с людьми: эксперимент Мишеля Сифра

Как проходил эксперимент Мишеля Сифра и к каким он пришел выводам

ТехИнсайдер
Филипп Киркоров: «Я привык жить вне шаблонов» Филипп Киркоров: «Я привык жить вне шаблонов»

Большой ребенок – так хочется описать Филиппа Киркорова (и это комплимент!)

VOICE
О чем фильм «Треугольник печали» Рубена Эстлунда, снова издевающегося над привилегированными людьми О чем фильм «Треугольник печали» Рубена Эстлунда, снова издевающегося над привилегированными людьми

Какую важную для себя тему Эстлунд прячет за критикой буржуазии

СНОБ
Астрологи, экстрасенсы, целители: почему люди идут к ним сегодня? Астрологи, экстрасенсы, целители: почему люди идут к ним сегодня?

Почему «бытовая магия» популярна в наш век высоких технологий?

Psychologies
От Афродиты до Рубенса: как менялось отношение к женскому телу в искусстве От Афродиты до Рубенса: как менялось отношение к женскому телу в искусстве

Почему нагота то уходила из искусства, то снова возвращалась?

Forbes
Совместные роды: вред или польза для отношений? Совместные роды: вред или польза для отношений?

Что такое партнерские роды и как они влияют на отношения

Psychologies
Потеря, тревога и стресс: как справиться с сильными переживаниями — 5 проверенных техник Потеря, тревога и стресс: как справиться с сильными переживаниями — 5 проверенных техник

Способы, которые помогают снизить уровень тревожности в трудные времена

Psychologies
Толкование снов: о чем говорит ваше бессознательное — познайте себя Толкование снов: о чем говорит ваше бессознательное — познайте себя

Способны ли мы узнать глубину нашей личности благодаря снам?

Psychologies
Топ-10 продуктов для здорового зимнего меню Топ-10 продуктов для здорового зимнего меню

Как помочь организму пережить холода?

Psychologies
Не можете избавиться от вредной привычки? 3 шага, которые помогут это сделать (даже без силы воли) Не можете избавиться от вредной привычки? 3 шага, которые помогут это сделать (даже без силы воли)

Почему мы так часто формируем привычки, которые только мешают?

Inc.
Пятнадцать натуральных средств для омоложения Пятнадцать натуральных средств для омоложения

Предотвратить мелкие «возрастные» неприятности можно и без помощи специалистов

Здоровье
Воронка вины: как формируется созависимость с алкоголиком Воронка вины: как формируется созависимость с алкоголиком

Почему зависимые люди «срываются» и возвращаются к алкоголю?

Psychologies
В поисках потустороннего мира: откуда у людей возникает тяга к мистике В поисках потустороннего мира: откуда у людей возникает тяга к мистике

Отрывок из книги «Битвы с экстрасенсами» — о мире ясновидящих и тарологов

Forbes
Песнь дыма и пламени Песнь дыма и пламени

Лучшие мастера приготовления блюд при помощи дыма и огня чаще обитают на юге

Bones
6 удивительных способов улучшить здоровье сердца: что говорят кардиологи 6 удивительных способов улучшить здоровье сердца: что говорят кардиологи

Как уберечь себя и свое сердце с помощью простых привычек

ТехИнсайдер
Убийства в «проклятом треугольнике»: история маньяка-черноколготочника Юрия Цюмана Убийства в «проклятом треугольнике»: история маньяка-черноколготочника Юрия Цюмана

Юрий Цюман: советский серийный убийца и насильник из Таганрога

VOICE
20 тревожных симптомов, что из ваших отношений уходит любовь 20 тревожных симптомов, что из ваших отношений уходит любовь

Проверьте не исчезает ли из ваших отношений то, что когда-то вас связало

Psychologies
Арт-мир, собранный в сумку Арт-мир, собранный в сумку

Новый этап проекта Dior Lady Art

Weekend
Как не переедать в новогодние праздники Как не переедать в новогодние праздники

Держим себя в форме во время праздников

Maxim
Насколько быстро бегает гепард: сможет ли гончая его обогнать? Насколько быстро бегает гепард: сможет ли гончая его обогнать?

Насколько гепарды быстры и что позволяет им развивать такую скорость?

ТехИнсайдер
Как понять все о мужчине по той позе, в которой он спит Как понять все о мужчине по той позе, в которой он спит

То, как мы спим, может многое о нас рассказать

VOICE
Комментатор «Матч ТВ» посетил все матчи ЧМ-2022. Но Книга рекордов Гиннесса не регистрирует его достижение Комментатор «Матч ТВ» посетил все матчи ЧМ-2022. Но Книга рекордов Гиннесса не регистрирует его достижение

Тимур Журавель спал по 4 часа и приезжал на 10 минут на футбол.

Maxim
Томограф, рентген и сгоревшие папирусы Томограф, рентген и сгоревшие папирусы

Рукописи из Геркуланума можно было расшифровать высокотехнологическими методами

Наука
Торжественное вручение Торжественное вручение

Поиск подарка под Новый год порой превращается в настоящий квест

VOICE
Уроки санскрита: что такое «кама мута» и как найти любовь в мелочах Уроки санскрита: что такое «кама мута» и как найти любовь в мелочах

Быть движимым любовью — что это за чувство и как оно наполняет жизнь смыслом?

Forbes
Способ снизить риск заражения гриппом: совет иммунолога Способ снизить риск заражения гриппом: совет иммунолога

Что нужно делать, чтобы избежать гриппа? Закаляться? Пить витамин Д?

ТехИнсайдер
Открыть в приложении