Поисковик, который умеет анализировать разбросанную по интернету информацию

ForbesБизнес

Всевидящее око: как стартап Diffbot собрал в Сети триллион фактов и обошел Google

Джиллиан Д'Онфро

michael_tung_diffbot.jpg__1557854984__13473.jpg
Фото The Demo Conference

Создатель Diffbot Майк Тен в юности прочитывал все попавшиеся ему книги одну за другой. Повзрослев, он придумал поисковик, который умеет собирать и анализировать разбросанную по интернету информацию. Его технология уже обошла Google по числу собранных данных. Но в отличие от интернет-гиганта работать он предпочитает с бизнесом, а не с обычными пользователями.

Компания Сisco хотела, чтобы пользователи ее сервиса видеоконференций могли получить информацию обо всех участниках видеозвонка, например, о том, где они раньше работали и упоминались ли они ранее в новостях. Для этого она решила воспользоваться услугами стартапа Diffbot из калифорнийского города Маунтин-Вью.

Diffbot занимается структурированием информации из интернета в соответствии с индивидуальными запросами клиентов. Созданная разработчиками Diffbot поисковая система «прочесывает» миллионы страниц и выдает результаты по заданным параметрам. Для Сisco система, к примеру, подбирает статьи, в которых упоминаются участники видеоконференции. Для производителя кроссовок Diffbot делает обзоры отзывов покупателей и обсуждений на форумах. А для разработчика программного обеспечения для бизнеса подыскивает потенциальных клиентов. Обычно чтобы собрать такого рода данные в полном объеме требуется много времени. Однако создатели стартапа утверждают, что Diffbot изучает практически все доступные веб-страницы и может предоставить результаты поиска менее чем за секунду.

«Люди не могут узнать все обо всем. Поэтому нам нужно создать систему, которая будет способна это сделать», — говорит основатель Diffbot Майк Тан.

Как Diffbot играет на поле Google

Компании из всех отраслей экономики нанимают все больше специалистов по обработке данных и используют технологии искусственного интеллекта для моделирования спроса на свои продукты, анализа угроз со стороны конкурентов и поиска новых клиентов. Однако при проведении любого анализа даже искусственному интеллекту нужно опираться на конкретные данные. Здесь вступает в игру Diffbot. Основатели стартапа уверяют, что их поисковая система предоставляет более полные данные, а также делает это быстрее, чем разработки конкурентов.

Тан, которому сейчас 36 лет, говорит, что после почти десяти лет фальстартов и технических прорывов команде Diffbot удалось создать поисковый индекс, который уже проанализировал 90% открытых интернет-ресурсов. По неполным подсчетам, база данных Diffbot состоит из более чем триллиона фактов.

Это огромный объем, даже если сравнивать с базой данных Google. У интернет-гиганта есть своя технология структурирования информации, которая получила название Knowledge Graph. Именно ее можно назвать источником всех ответов, которые появляются в топе поиска, когда пользователи задают определенные вопросы. Последний раз Google обнародовала информацию о Knowledge Graph в конце 2016 года, и тогда в базе данных системы было лишь 70 млрд фактов.

Как и Knowledge Graph, поисковая система Diffbot постоянно просматривает миллиарды веб-страниц. Однако стартап использует поисковый индекс не для того, чтобы дать людям наиболее релевантные ссылки на информацию: Diffbot предоставляет компаниям данные, которые они могут затем интегрировать в свои собственные аналитические инструменты.

Diffbot привлек финансирование на сумму $12 млн и смог обзавестись несколькими именитыми клиентами, вроде Salesforce, eBay, Snapchat и Intel. В прошлом году доходы компании составили почти $5 млн. По мнению Тана, продажи вскоре могут удвоиться, поскольку все больше компаний находится в поиске крупномасштабных баз данных.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

От мини-юбок до сжигания хиджабов: как за 100 лет поменялось положение женщин в Иране От мини-юбок до сжигания хиджабов: как за 100 лет поменялось положение женщин в Иране

Как положение иранок в обществе становилось манипуляцией со стороны властей

Forbes
На чужой территории На чужой территории

Сравнительный тест Toyota Corolla и Hyundai Elantra

АвтоМир
Вотум недоверия: с чем сталкиваются 20-летние, становясь руководителями Вотум недоверия: с чем сталкиваются 20-летние, становясь руководителями

Эйджизм и дискриминация: проблемы молодых управленцев

Forbes
На два голоса На два голоса

Эта тбилисская кВартиНа — мечта о переезде в небольшой южный город насовсем

Seasons of life
Психологический портрет: что такое сейфтизм Психологический портрет: что такое сейфтизм

Сейфтизм: что это такое и чего в нем больше — пользы или вреда?

Forbes
Разогреть и приготовить: рейтинг микроволновых печей 2019 Разогреть и приготовить: рейтинг микроволновых печей 2019

Что нужно учитывать при выборе и на что обратить внимание при покупке СВЧ-печи

CHIP
Текущие планы Текущие планы

Куда поехать тем, кто любит отдых у воды? В термы или на море?

Cosmopolitan
Собор Парижской Богоматери Собор Парижской Богоматери

Нотр-Дам не сгорел, хоть и сильно пострадал

Дилетант
Почему мы страдаем, когда кончается любимый сериал (объясняют эксперты) Почему мы страдаем, когда кончается любимый сериал (объясняют эксперты)

Ну и как теперь дальше жить без «Игры престолов»

Playboy
Сильнейшие футбольные лиги Европы заработали в прошлом сезоне рекордные €15,6 млрд Сильнейшие футбольные лиги Европы заработали в прошлом сезоне рекордные €15,6 млрд

Больше всех в сезоне 2017/18 заработала английская Премьер-лига

Forbes
Рот на замок Рот на замок

Во всем ли стоит сознаваться?

StarHit
Ваш летний чекап Ваш летний чекап

Ежегодные обследования – очень даже неплохая идея

Домашний Очаг
8 профессий, которые повышают риск возникновения рака (даже механик) 8 профессий, которые повышают риск возникновения рака (даже механик)

Профессии, которые связаны с постоянным негативным воздействием на организм

Playboy
Глыба. Символ эпохи. Журналисты и политики вспоминают Сергея Доренко Глыба. Символ эпохи. Журналисты и политики вспоминают Сергея Доренко

9 мая в Москве умер журналист Сергей Доренко

Esquire
MAXIM посмотрел фильм «Куриоса» об индустрии взрослых развлечений в XIX веке MAXIM посмотрел фильм «Куриоса» об индустрии взрослых развлечений в XIX веке

Куриоса (Curiosa), Франция, режиссер Лу Жене

Maxim
Автобусы-монстры и трамваи-убийцы: опыт войны Автобусы-монстры и трамваи-убийцы: опыт войны

Пополнять ряды вооруженных сил призывали машины из повседневной жизни

Популярная механика
«Черепаха» Джефф Безос и «заяц» Илон Маск: кто из миллиардеров выиграет лунную гонку «Черепаха» Джефф Безос и «заяц» Илон Маск: кто из миллиардеров выиграет лунную гонку

Чем похожи и чем отличаются амбициозные проекты главных космических энтузиастов

Forbes
Дана Борисова: «Дочь смогла простить меня» Дана Борисова: «Дочь смогла простить меня»

О счастливом финале страшного скандала между мамой и дочкой

StarHit
«Игра престолов»: финал в пересказе Cosmo. Серия 4 «Игра престолов»: финал в пересказе Cosmo. Серия 4

Напряжение нарастает!

Cosmopolitan
Mazda6: Еще рывочек Mazda6: Еще рывочек

«Шестерка» всегда балансировала на грани премиума

АвтоМир
Забудь его, забудь... Забудь его, забудь...

Как перебороть свои чувства и выбросить его из головы, если ты ему безразлична

StarHit
Минимум миниморум Минимум миниморум

Стоит ли вообще интересоваться кроссоверами, если предлагают эффективное плацебо

АвтоМир
Почему многозадачность — главный враг успеха на работе Почему многозадачность — главный враг успеха на работе

Как оставаться продуктивным на работе, продолжая использовать высокие технологии

Forbes
Солнце и предубеждение: почему солнечная энергетика не приживается в России? Солнце и предубеждение: почему солнечная энергетика не приживается в России?

В России внедрение новых технологий сталкивается с неожиданными преградами

Forbes
Александр и Михаил Воеводины. Отец и сын Александр и Михаил Воеводины. Отец и сын

В семейной войне не бывает победителей, только растоптанные судьбы и души

Караван историй
От «у меня не получится» к «как мне это сделать»: учимся мыслить проактивно От «у меня не получится» к «как мне это сделать»: учимся мыслить проактивно

Кто из нас не рисовал в голове идеальный образ будущего, далекого и не очень

Psychologies
Как быстро выучить текст: 7 лайфхаков Как быстро выучить текст: 7 лайфхаков

Как быстро выучить любой, даже самый сложный и длинный текст

Psychologies
Черное зеркало, светлая сторона Черное зеркало, светлая сторона

С тех пор как айфон узнает нас в лицо, мы живем в новой реальности

Glamour
На смену «Черному ястребу»: конвертоплан Bell V-280 Valor На смену «Черному ястребу»: конвертоплан Bell V-280 Valor

Конвертоплан V-280 Valor завершил испытания

Популярная механика
В деле «Седьмой студии» Кирилла Серебренникова появился новый подозреваемый В деле «Седьмой студии» Кирилла Серебренникова появился новый подозреваемый

Новым подозреваемым в деле «Седьмой студии» стал предприниматель из Петербурга

Forbes
Открыть в приложении