Поисковик, который умеет анализировать разбросанную по интернету информацию

ForbesБизнес

Всевидящее око: как стартап Diffbot собрал в Сети триллион фактов и обошел Google

Джиллиан Д'Онфро

michael_tung_diffbot.jpg__1557854984__13473.jpg
Фото The Demo Conference

Создатель Diffbot Майк Тен в юности прочитывал все попавшиеся ему книги одну за другой. Повзрослев, он придумал поисковик, который умеет собирать и анализировать разбросанную по интернету информацию. Его технология уже обошла Google по числу собранных данных. Но в отличие от интернет-гиганта работать он предпочитает с бизнесом, а не с обычными пользователями.

Компания Сisco хотела, чтобы пользователи ее сервиса видеоконференций могли получить информацию обо всех участниках видеозвонка, например, о том, где они раньше работали и упоминались ли они ранее в новостях. Для этого она решила воспользоваться услугами стартапа Diffbot из калифорнийского города Маунтин-Вью.

Diffbot занимается структурированием информации из интернета в соответствии с индивидуальными запросами клиентов. Созданная разработчиками Diffbot поисковая система «прочесывает» миллионы страниц и выдает результаты по заданным параметрам. Для Сisco система, к примеру, подбирает статьи, в которых упоминаются участники видеоконференции. Для производителя кроссовок Diffbot делает обзоры отзывов покупателей и обсуждений на форумах. А для разработчика программного обеспечения для бизнеса подыскивает потенциальных клиентов. Обычно чтобы собрать такого рода данные в полном объеме требуется много времени. Однако создатели стартапа утверждают, что Diffbot изучает практически все доступные веб-страницы и может предоставить результаты поиска менее чем за секунду.

«Люди не могут узнать все обо всем. Поэтому нам нужно создать систему, которая будет способна это сделать», — говорит основатель Diffbot Майк Тан.

Как Diffbot играет на поле Google

Компании из всех отраслей экономики нанимают все больше специалистов по обработке данных и используют технологии искусственного интеллекта для моделирования спроса на свои продукты, анализа угроз со стороны конкурентов и поиска новых клиентов. Однако при проведении любого анализа даже искусственному интеллекту нужно опираться на конкретные данные. Здесь вступает в игру Diffbot. Основатели стартапа уверяют, что их поисковая система предоставляет более полные данные, а также делает это быстрее, чем разработки конкурентов.

Тан, которому сейчас 36 лет, говорит, что после почти десяти лет фальстартов и технических прорывов команде Diffbot удалось создать поисковый индекс, который уже проанализировал 90% открытых интернет-ресурсов. По неполным подсчетам, база данных Diffbot состоит из более чем триллиона фактов.

Это огромный объем, даже если сравнивать с базой данных Google. У интернет-гиганта есть своя технология структурирования информации, которая получила название Knowledge Graph. Именно ее можно назвать источником всех ответов, которые появляются в топе поиска, когда пользователи задают определенные вопросы. Последний раз Google обнародовала информацию о Knowledge Graph в конце 2016 года, и тогда в базе данных системы было лишь 70 млрд фактов.

Как и Knowledge Graph, поисковая система Diffbot постоянно просматривает миллиарды веб-страниц. Однако стартап использует поисковый индекс не для того, чтобы дать людям наиболее релевантные ссылки на информацию: Diffbot предоставляет компаниям данные, которые они могут затем интегрировать в свои собственные аналитические инструменты.

Diffbot привлек финансирование на сумму $12 млн и смог обзавестись несколькими именитыми клиентами, вроде Salesforce, eBay, Snapchat и Intel. В прошлом году доходы компании составили почти $5 млн. По мнению Тана, продажи вскоре могут удвоиться, поскольку все больше компаний находится в поиске крупномасштабных баз данных.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Уже не косметика, но еще не лекарство: чем опасна космецевтика Уже не косметика, но еще не лекарство: чем опасна космецевтика

Чем опасно бесконтрольное применение космецевтики?

Forbes
Гай Ричи, Уилл Смит и актеры из “Аладдина” — о волшебстве и впечатлениях от работы над фильмом Гай Ричи, Уилл Смит и актеры из “Аладдина” — о волшебстве и впечатлениях от работы над фильмом

Esquire встретился с режиссером и актерами фильма «Аладдин»

Esquire
Бесплатные приложения для планирования: какое выбрать Бесплатные приложения для планирования: какое выбрать

Бесплатные приложения-планировщики: чем отличаются и какое стоит попробовать?

Inc.
Берегите друзей Берегите друзей

Их разделяют сотни тысяч рублей, но философия у Lada 4x4 и Renault Duster схожая

АвтоМир
8 доказанных наукой привычек, которые действительно повышают интеллект 8 доказанных наукой привычек, которые действительно повышают интеллект

Какие ритуалы стоит добавить в свою рутину, чтобы стать умнее

Maxim
Не боится Вирджинии Вулф Не боится Вирджинии Вулф

Англичанке Джемме Артертон черт не брат

Vogue
Качели для инвестора: как заработать на нестабильном рынке Качели для инвестора: как заработать на нестабильном рынке

Инструменты, которые позволяют получать доход и во время падения индексов

Forbes
«Безопасность – рецессивный или спящий ген WhatsApp». Дуров раскритиковал мессенджер за проблемы с защитой данных «Безопасность – рецессивный или спящий ген WhatsApp». Дуров раскритиковал мессенджер за проблемы с защитой данных

«WhatsApp никогда не будет защищенным», утверждает Павел Дуров

Forbes
Золотая соломинка: как предприниматель из Петербурга заработал 150 млн рублей на отказе бизнеса от пластика Золотая соломинка: как предприниматель из Петербурга заработал 150 млн рублей на отказе бизнеса от пластика

Сколько приносит «зеленый» бизнес и почему у экологов есть к нему претензии?

Forbes
Крупнейший независимый НПЗ России попросил признать себя банкротом Крупнейший независимый НПЗ России попросил признать себя банкротом

Антипинский НПЗ 18 мая направил в суд заявление о банкротстве

Forbes
В МГУ сделали искусственную кожу из наноёршиков В МГУ сделали искусственную кожу из наноёршиков

Команда учёных исследовала параметры биосовместимых самоорганизующихся полимеров

Популярная механика
Они же голые! Виктория Боня, Ванесса Паради и другие нудисты среди звезд Они же голые! Виктория Боня, Ванесса Паради и другие нудисты среди звезд

Знаменитости, которые любят загорать без одежды

Cosmopolitan
Аида Гарифуллина: «Красота начинается с твоих мыслей!» Аида Гарифуллина: «Красота начинается с твоих мыслей!»

Аида Гарифуллина – одна из самых востребованных оперных певиц в мире

Cosmopolitan
6 главных вопросов к финалу «Игры престолов» 6 главных вопросов к финалу «Игры престолов»

«Игра престолов» закончилась, а вопросы остались

Esquire
Павел Дуров написал колонку, в которой раскритиковал конкурента Telegram — WhatsApp. Публикуем перевод Павел Дуров написал колонку, в которой раскритиковал конкурента Telegram — WhatsApp. Публикуем перевод

Основатель VKontakte и Telegram жестко раскритиковал WhatsApp и Facebook

Esquire
Хлои Кардашьян избила стриптизершу, которую поймала в гостинице с мужем Хлои Кардашьян избила стриптизершу, которую поймала в гостинице с мужем

Первый муж Хлои Кардашьян рассказал, как она застала его в гостинице с девицами

Cosmopolitan
В своем репертуаре В своем репертуаре

Режиссер Гай Ричи рассказал о своей новой картине «Аладдин»

Grazia
Первая Мировая война: оружие Русской армии Первая Мировая война: оружие Русской армии

Входя в союз победителей, Россия потеряла все и погрузилась в хаос

Популярная механика
Экоактивизм вместо урока биологии: кто такая 16-летняя Грета Тунберг и за что ее номинировали на Нобелевскую премию Экоактивизм вместо урока биологии: кто такая 16-летняя Грета Тунберг и за что ее номинировали на Нобелевскую премию

Шведская школьница Грета Тунберг претендует на Нобелевскую премию мира

Esquire
20 самых смешных реакций на 4 серию финального сезона «Игры престолов» 20 самых смешных реакций на 4 серию финального сезона «Игры престолов»

Сеть наполнилась старыми-добрыми смешными твитами про «Игру престолов»

Playboy
Рассуждай экологично Рассуждай экологично

Быть экофрендли – это не только модно, этично и полезно, но и выгодно

Cosmopolitan
Призрак свободы Призрак свободы

Как жители крошечной республики Сан-Марино сохраняют свою независимость

Вокруг света
Когда актеры были большими: «Однажды в Голливуде» Квентина Тарантино Когда актеры были большими: «Однажды в Голливуде» Квентина Тарантино

На Каннском кинофестивале прошла премьера самого ожидаемого авторского фильма

Forbes
Спасибо маме: как Наоми Осака становится самой высокооплачиваемой спортсменкой мира Спасибо маме: как Наоми Осака становится самой высокооплачиваемой спортсменкой мира

Что превращают молодую теннисистку в маркетинговую звезду

Forbes
Вам не нужен драйв — вам нужно терпение Вам не нужен драйв — вам нужно терпение

Мы часто забываем о качестве, без которого не достигнуть успеха — о терпении

Psychologies
А на том берегу А на том берегу

Все, что нужно знать о 72-м Международном Каннском кинофестивале

Grazia
План расслабления на день: три лайфхака для идеальной работоспособности План расслабления на день: три лайфхака для идеальной работоспособности

Те, кто умеет расслабляться, выполняют творческие задачи более эффективно

Psychologies
Амнистия не для всех. Почему российские бизнесмены не спешат возвращать свои капиталы Амнистия не для всех. Почему российские бизнесмены не спешат возвращать свои капиталы

За вторую амнистию капиталов в Россию было репатриировано более €10 млрд

Forbes
Обзор смарт-часов MyKronoz ZeRound 2 HR Elite: родом из Швейцарии Обзор смарт-часов MyKronoz ZeRound 2 HR Elite: родом из Швейцарии

Тестируем умные часы от компании MyKronoz

CHIP
Россия сокращает расходы на оборону. Что это значит для экономики Россия сокращает расходы на оборону. Что это значит для экономики

Россия не вошла в первую пятерку государств по оборонным расходам

Forbes
Открыть в приложении