Поисковик, который умеет анализировать разбросанную по интернету информацию

ForbesБизнес

Всевидящее око: как стартап Diffbot собрал в Сети триллион фактов и обошел Google

Джиллиан Д'Онфро

michael_tung_diffbot.jpg__1557854984__13473.jpg
Фото The Demo Conference

Создатель Diffbot Майк Тен в юности прочитывал все попавшиеся ему книги одну за другой. Повзрослев, он придумал поисковик, который умеет собирать и анализировать разбросанную по интернету информацию. Его технология уже обошла Google по числу собранных данных. Но в отличие от интернет-гиганта работать он предпочитает с бизнесом, а не с обычными пользователями.

Компания Сisco хотела, чтобы пользователи ее сервиса видеоконференций могли получить информацию обо всех участниках видеозвонка, например, о том, где они раньше работали и упоминались ли они ранее в новостях. Для этого она решила воспользоваться услугами стартапа Diffbot из калифорнийского города Маунтин-Вью.

Diffbot занимается структурированием информации из интернета в соответствии с индивидуальными запросами клиентов. Созданная разработчиками Diffbot поисковая система «прочесывает» миллионы страниц и выдает результаты по заданным параметрам. Для Сisco система, к примеру, подбирает статьи, в которых упоминаются участники видеоконференции. Для производителя кроссовок Diffbot делает обзоры отзывов покупателей и обсуждений на форумах. А для разработчика программного обеспечения для бизнеса подыскивает потенциальных клиентов. Обычно чтобы собрать такого рода данные в полном объеме требуется много времени. Однако создатели стартапа утверждают, что Diffbot изучает практически все доступные веб-страницы и может предоставить результаты поиска менее чем за секунду.

«Люди не могут узнать все обо всем. Поэтому нам нужно создать систему, которая будет способна это сделать», — говорит основатель Diffbot Майк Тан.

Как Diffbot играет на поле Google

Компании из всех отраслей экономики нанимают все больше специалистов по обработке данных и используют технологии искусственного интеллекта для моделирования спроса на свои продукты, анализа угроз со стороны конкурентов и поиска новых клиентов. Однако при проведении любого анализа даже искусственному интеллекту нужно опираться на конкретные данные. Здесь вступает в игру Diffbot. Основатели стартапа уверяют, что их поисковая система предоставляет более полные данные, а также делает это быстрее, чем разработки конкурентов.

Тан, которому сейчас 36 лет, говорит, что после почти десяти лет фальстартов и технических прорывов команде Diffbot удалось создать поисковый индекс, который уже проанализировал 90% открытых интернет-ресурсов. По неполным подсчетам, база данных Diffbot состоит из более чем триллиона фактов.

Это огромный объем, даже если сравнивать с базой данных Google. У интернет-гиганта есть своя технология структурирования информации, которая получила название Knowledge Graph. Именно ее можно назвать источником всех ответов, которые появляются в топе поиска, когда пользователи задают определенные вопросы. Последний раз Google обнародовала информацию о Knowledge Graph в конце 2016 года, и тогда в базе данных системы было лишь 70 млрд фактов.

Как и Knowledge Graph, поисковая система Diffbot постоянно просматривает миллиарды веб-страниц. Однако стартап использует поисковый индекс не для того, чтобы дать людям наиболее релевантные ссылки на информацию: Diffbot предоставляет компаниям данные, которые они могут затем интегрировать в свои собственные аналитические инструменты.

Diffbot привлек финансирование на сумму $12 млн и смог обзавестись несколькими именитыми клиентами, вроде Salesforce, eBay, Snapchat и Intel. В прошлом году доходы компании составили почти $5 млн. По мнению Тана, продажи вскоре могут удвоиться, поскольку все больше компаний находится в поиске крупномасштабных баз данных.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Вложения в чемпионство: как бывший fashion-инвестор создает топ-команду «Формулы-1» Вложения в чемпионство: как бывший fashion-инвестор создает топ-команду «Формулы-1»

Тактика канадского бизнесмена Лоуренс Стролла в «Формуле-1» и к чему она привела

Forbes
Золотая соломинка: как предприниматель из Петербурга заработал 150 млн рублей на отказе бизнеса от пластика Золотая соломинка: как предприниматель из Петербурга заработал 150 млн рублей на отказе бизнеса от пластика

Сколько приносит «зеленый» бизнес и почему у экологов есть к нему претензии?

Forbes
Правила взаимности: при каких условиях деловые знакомства превращаются в бизнес-связи Правила взаимности: при каких условиях деловые знакомства превращаются в бизнес-связи

Как нетворкинг-туры помогают договариваться о выгодных контрактах и партнерствах

Forbes
Начало шестого Начало шестого

Владимир Зеленский официально приступил к исполнению своих обязанностей

Огонёк
Личинки, серебро и кровопускание: как люди лечились до появления антибиотиков Личинки, серебро и кровопускание: как люди лечились до появления антибиотиков

Как люди лечились до открытия пенициллина?

ТехИнсайдер
Чтобы помнили Чтобы помнили

Вечная тема войны и мира звучит в майские дни особенно актуально

OK!
«Мы будем точно не хуже Google и Apple». Что Сбербанк рассказал акционерам на годовом собрании «Мы будем точно не хуже Google и Apple». Что Сбербанк рассказал акционерам на годовом собрании

Forbes собрал самое главное с годового собрания акционеров Сбербанка

Forbes
Лондон, гудбай! Как Brexit ударит по финансовым стартапам Европы Лондон, гудбай! Как Brexit ударит по финансовым стартапам Европы

Из-за Brexit Лондон потеряет статус финансовой столицы Европы

Forbes
Ирина Апексимова. Стены и углы Таганки Ирина Апексимова. Стены и углы Таганки

Интервью с руководителем Театра на Таганке Ириной Апексимовой

СНОБ
Что происходит с организмом, когда ты пьешь алкоголь в жару (и как этого избежать) Что происходит с организмом, когда ты пьешь алкоголь в жару (и как этого избежать)

Скоро лето, а значит будет много алкоголя на природе

Playboy
Дочери Карины Мишулиной: «Из обмана ничего путного не выйдет» Дочери Карины Мишулиной: «Из обмана ничего путного не выйдет»

Карина Мишулина о том, как без запретов воспитать двух идеальных наследниц

StarHit
«Продались»: звезды, в соцсетях которых слишком много рекламы «Продались»: звезды, в соцсетях которых слишком много рекламы

У кого из звезд рекламных постов едва ли не больше, чем любых других публикаций

Cosmopolitan
Опыт читателя: создаем видеонаблюдение на даче своими силами Опыт читателя: создаем видеонаблюдение на даче своими силами

Можно использовать готовые решения или создать свое

CHIP
Неуместный посол Неуместный посол

Почему Россия продолжает поддерживать невыгодное Союзное государство?

Эксперт
Сердечные электрики: как кардиостимуляторы помогают сердцу биться Сердечные электрики: как кардиостимуляторы помогают сердцу биться

Сердце человека — это электромеханический насос

Популярная механика
Обзор смарт-часов MyKronoz ZeRound 2 HR Elite: родом из Швейцарии Обзор смарт-часов MyKronoz ZeRound 2 HR Elite: родом из Швейцарии

Тестируем умные часы от компании MyKronoz

CHIP
Минимум миниморум Минимум миниморум

Стоит ли вообще интересоваться кроссоверами, если предлагают эффективное плацебо

АвтоМир
«Не воспринимается как история роста»: в Morgan Stanley поделились опасениями по поводу будущего Tesla «Не воспринимается как история роста»: в Morgan Stanley поделились опасениями по поводу будущего Tesla

Tesla — компания с проблемной кредитной историей

Forbes
Как делать деньги на молодых художниках. Лайфхаки берлинского галериста Как делать деньги на молодых художниках. Лайфхаки берлинского галериста

Галерист Роберт Грюненберг, который привез в Москву работы Яна Цоллера

Forbes
Нелегкая инфекция Нелегкая инфекция

Опасность заразиться туберкулезом по-прежнему существует и в наше время

Лиза
Илья Белов: Илья Белов:

Как блогер Илья Белов заработал миллион подписчиков в Инстаграм

Cosmopolitan
Ольга Лаврентьева Ольга Лаврентьева

Художник и писатель нарисовала документальный комикс-эпос «Сурвило»

Собака.ru
Знаки внимания Знаки внимания

Подобрать идеальный крем можно и без косметолога, если правильно читать этикетки

Лиза
Весенняя романтика: 9 кокетливых юбок для чувственного образа Весенняя романтика: 9 кокетливых юбок для чувственного образа

Для прогулок теплыми, майскими вечерами выбирай романтичные юбки длины миди

Cosmopolitan
«Единорог» Чубайса: кто построил первый проект «Роснано» стоимостью $1 млрд «Единорог» Чубайса: кто построил первый проект «Роснано» стоимостью $1 млрд

Как основатели OCSiAl собираются завоевать мир со своим продуктом?

Forbes
10 сериалов о женщинах, которые ломают стереотипы 10 сериалов о женщинах, которые ломают стереотипы

Десять лучших новых сериалов с очень интересными героинями

Forbes
Как едет Range Rover за 1 миллиард фунтов стерлингов? Как едет Range Rover за 1 миллиард фунтов стерлингов?

Один миллиард фунтов стерлингов был потрачен на разработку этого автомобиля

GQ
Самые непредсказуемые фильмы Каннского фестиваля: от Гаспара Ноэ до пародии на “Черное зеркало” Самые непредсказуемые фильмы Каннского фестиваля: от Гаспара Ноэ до пародии на “Черное зеркало”

В эту подборку попали фильмы, которые притворяются жанровым кино

Esquire
Сергей Лазарев сообщил подробности голосования зрителей и судей на «Евровидении» Сергей Лазарев сообщил подробности голосования зрителей и судей на «Евровидении»

36-летний Сергей Лазарев занял на «Евровидении» третье место

Cosmopolitan
Хочешь новых друзей? 4 способа найти их онлайн (и не показаться маньяком) Хочешь новых друзей? 4 способа найти их онлайн (и не показаться маньяком)

Кто сказал, что так делать нельзя?!

Playboy
Открыть в приложении