Компания OpenAI представила мультимодальную генеративную модель GPT-4o

N+1Hi-Tech

OpenAI представила мультимодальную генеративную модель GPT-4o

Она умеет разговаривать, видеть, и имитирует эмоции

Андрей Фокин

0feba817682cb3557f5dd3b9a38f3ae7.jpg
OpenAI / YouTube

Компания OpenAI представила мультимодальную генеративную модель GPT-4o, которая может работать с текстом, аудио и изображениями, включая видео. Модель может общаться с пользователем голосом и поддерживает 50 языков. Она может имитировать различные интонации, шепот, пение, смех. При этом модель работает гораздо быстрее предшествующей версии — время задержки ответа в голосовом режиме составляет в среднем около 0,3 секунды, что сравнимо с временем реакции человека. Также модель может видеть, получая и интерпретируя изображение с камеры в реальном времени. Трансляция презентации велась на YouTube.

Первая генеративная языковая модель уровня GPT-4 была представлена компанией OpenAI в марте 2023 года. В отличие от более ранней версии GPT-3.5, которая могла работать только с текстовой информацией, GPT-4 впервые получила способность принимать в качестве входных данных также и изображения. Кроме этого, в том же году состоялся релиз приложения на основе чат-бота ChatGPT с возможностью распознавания речи и синтеза голоса, что позволяло пользователям разговаривать с моделью и использовать ее в роли голосового ассистента.

В понедельник 13 мая 2024 года во время прямой трансляции на YouTube состоялась презентация новой версии GPT-4, которая получила обозначение GPT-4o (символ «о» в конце означает «omni»). Теперь модель принимает в качестве входных данных любую комбинацию текста, звука и изображения, включая видео. При этом она работает гораздо быстрее своей предшественницы, в том числе и во время голосового общения. Генерация ответа происходит со средней задержкой всего лишь 320 миллисекунд, что сравнимо со временем реакции человека в разговоре.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Все уровни беспилотности Все уровни беспилотности

Из пункта А в пункт Б выехал автомобиль — казалось бы, что может быть проще?

ТехИнсайдер
Робозмею научили локоманипулировать предметами Робозмею научили локоманипулировать предметами

Робот-змея может двигаться и перемещать предметы одновременно

N+1
Двухтактные и четырехтактные мотокосы — в чем между ними разница и какой триммер лучше? Двухтактные и четырехтактные мотокосы — в чем между ними разница и какой триммер лучше?

Какой тип ДВС лучше выбрать для мотокосы

CHIP
Золотая комната Золотая комната

К дикому племени спускается сияющий человек в скафандре и протягивает к ним руку

Знание – сила
Зеркальце, перышко и пучок льна: как на Руси без врачей определяли наступление смерти Зеркальце, перышко и пучок льна: как на Руси без врачей определяли наступление смерти

Как и кто на Руси констатировал смерть в момент её наступления?

ТехИнсайдер
Мадс Миккельсен. Великий и ужасный Мадс Миккельсен. Великий и ужасный

Он никогда не мечтал сниматься в кино и вообще становиться  актером

Караван историй
ДКС: двигатель технологической революции в России ДКС: двигатель технологической революции в России

Глава компании ДКС: «Нам нужно постоянно крутить педали — и мы это делаем»

Монокль
Как вежливо отказать человеку? Узнайте простые советы, чтобы никого не обидеть! Как вежливо отказать человеку? Узнайте простые советы, чтобы никого не обидеть!

Как и любой новый навык, умение говорить «нет» требует практики

ТехИнсайдер
Можно ли подружить кошку с собакой? Рассказываем, как правильно это сделать Можно ли подружить кошку с собакой? Рассказываем, как правильно это сделать

Неужели правда, что кот и пес — это заведомо враги?

ТехИнсайдер
Почему мы любим делать несколько дел сразу: пример «обеда за просмотром кино» Почему мы любим делать несколько дел сразу: пример «обеда за просмотром кино»

Есть, отвлекаясь на сериал, — один из самых простых способов переесть

ТехИнсайдер
Intel UHD Graphics или Intel Iris Xe Graphics: что лучше Intel UHD Graphics или Intel Iris Xe Graphics: что лучше

Муки выбора между графикой Intel UHD Graphics и Intel Iris Xe... В чем отличия?

CHIP
Катерина Киндрук: Исторический момент ставит перед бизнесом нестандартные задачи Катерина Киндрук: Исторический момент ставит перед бизнесом нестандартные задачи

Какими качествами нужно обладать эффективному топ-менеджеру?

СНОБ
Между Оруэллом и Хаксли: 10 отличных сериалов-антиутопий Между Оруэллом и Хаксли: 10 отличных сериалов-антиутопий

Сериалы-антиутопии: от инкубаторов для детей до религиозных конфликтов

Правила жизни
Оцифрованный фитнес Оцифрованный фитнес

Виртуальная реальность и искусственный интеллект добрались и до тренажеров

ТехИнсайдер
Любовный треугольник: можно ли любить одновременно двоих? Любовный треугольник: можно ли любить одновременно двоих?

Что такое любовь? Почему люди заводят романы на стороне?

Psychologies
Путешествие к себе Путешествие к себе

Отложенная жизнь превращается из отложенных на будущее планов в призрачные мечты

Новый очаг
Люди ледникового периода использовали черепах как «контейнеры с едой»! Интересный факт Люди ледникового периода использовали черепах как «контейнеры с едой»! Интересный факт

Черепахи могли быть «живым источником пиши» для людей ледникового периода

ТехИнсайдер
Бей, молись, беги Бей, молись, беги

Игры с мячом и битой – древнейшие развлечения человечества

Вокруг света
Как благодарность меняет мозг: 3 неожиданных вывода психологов Как благодарность меняет мозг: 3 неожиданных вывода психологов

Как работает практика благодарности и правда ли она так полезна?

Psychologies
Исследование: мужчины, как правило, выбирают себе друзей с другим вкусом на девушек Исследование: мужчины, как правило, выбирают себе друзей с другим вкусом на девушек

Мужчины стараются дружить с теми, у кого вкус на девушек не совпадает с их

ТехИнсайдер
Пятый, индустриальный Пятый, индустриальный

Кадровые перестановки в правительстве и Администрации президента

Монокль
Мария Михалкова-Кончаловская: «Каждый проходит через отречение, чтобы потом понять, насколько это ценный дар — семья» Мария Михалкова-Кончаловская: «Каждый проходит через отречение, чтобы потом понять, насколько это ценный дар — семья»

Неважно, кто твои предки. Параллели прослеживаются ведь в любой семье

Коллекция. Караван историй
Новые пассажиры «Титаника» Новые пассажиры «Титаника»

Когда в 90-х годах упало финансирование науки, институты РАН выживали, как могли

Наука и техника
Где в мозге находится компас, который помогает нам не заблудиться Где в мозге находится компас, который помогает нам не заблудиться

Ученые впервые смогли определить местоположение внутреннего нейронного компаса

ТехИнсайдер
10 крупных народов, у которых нет своего государства 10 крупных народов, у которых нет своего государства

В мире существует большое число этносов, лишенных собственного государства

ТехИнсайдер
Как справиться с завистью к подруге: советует психолог Как справиться с завистью к подруге: советует психолог

Почему возникает зависть к подруге, как с ней эффективно справиться?

VOICE
4 типа детского темперамента 4 типа детского темперамента

Четыре типа детского темперамента и четыре подхода к общению с детьми

Psychologies
«ОКМО» возможностей «ОКМО» возможностей

Индекс коммуникационной состоятельности  медийных команд атомных городов

Позитивные изменения
Мария Аниканова: «Сергей Соловьев написал за меня сочинение, когда я призналась, что никогда в жизни его не напишу» Мария Аниканова: «Сергей Соловьев написал за меня сочинение, когда я призналась, что никогда в жизни его не напишу»

«У Соловьева на площадке царила особая атмосфера, которая просто обволакивала»

Караван историй
Путь Лиланда Стэнфорда от «барона-разбойника» к символу креативной экономики Путь Лиланда Стэнфорда от «барона-разбойника» к символу креативной экономики

Как лихой «барон» потратил свой капитал на создание культурного наследия

Forbes
Открыть в приложении