Поисковик, который умеет анализировать разбросанную по интернету информацию

ForbesБизнес

Всевидящее око: как стартап Diffbot собрал в Сети триллион фактов и обошел Google

Джиллиан Д'Онфро

michael_tung_diffbot.jpg__1557854984__13473.jpg
Фото The Demo Conference

Создатель Diffbot Майк Тен в юности прочитывал все попавшиеся ему книги одну за другой. Повзрослев, он придумал поисковик, который умеет собирать и анализировать разбросанную по интернету информацию. Его технология уже обошла Google по числу собранных данных. Но в отличие от интернет-гиганта работать он предпочитает с бизнесом, а не с обычными пользователями.

Компания Сisco хотела, чтобы пользователи ее сервиса видеоконференций могли получить информацию обо всех участниках видеозвонка, например, о том, где они раньше работали и упоминались ли они ранее в новостях. Для этого она решила воспользоваться услугами стартапа Diffbot из калифорнийского города Маунтин-Вью.

Diffbot занимается структурированием информации из интернета в соответствии с индивидуальными запросами клиентов. Созданная разработчиками Diffbot поисковая система «прочесывает» миллионы страниц и выдает результаты по заданным параметрам. Для Сisco система, к примеру, подбирает статьи, в которых упоминаются участники видеоконференции. Для производителя кроссовок Diffbot делает обзоры отзывов покупателей и обсуждений на форумах. А для разработчика программного обеспечения для бизнеса подыскивает потенциальных клиентов. Обычно чтобы собрать такого рода данные в полном объеме требуется много времени. Однако создатели стартапа утверждают, что Diffbot изучает практически все доступные веб-страницы и может предоставить результаты поиска менее чем за секунду.

«Люди не могут узнать все обо всем. Поэтому нам нужно создать систему, которая будет способна это сделать», — говорит основатель Diffbot Майк Тан.

Как Diffbot играет на поле Google

Компании из всех отраслей экономики нанимают все больше специалистов по обработке данных и используют технологии искусственного интеллекта для моделирования спроса на свои продукты, анализа угроз со стороны конкурентов и поиска новых клиентов. Однако при проведении любого анализа даже искусственному интеллекту нужно опираться на конкретные данные. Здесь вступает в игру Diffbot. Основатели стартапа уверяют, что их поисковая система предоставляет более полные данные, а также делает это быстрее, чем разработки конкурентов.

Тан, которому сейчас 36 лет, говорит, что после почти десяти лет фальстартов и технических прорывов команде Diffbot удалось создать поисковый индекс, который уже проанализировал 90% открытых интернет-ресурсов. По неполным подсчетам, база данных Diffbot состоит из более чем триллиона фактов.

Это огромный объем, даже если сравнивать с базой данных Google. У интернет-гиганта есть своя технология структурирования информации, которая получила название Knowledge Graph. Именно ее можно назвать источником всех ответов, которые появляются в топе поиска, когда пользователи задают определенные вопросы. Последний раз Google обнародовала информацию о Knowledge Graph в конце 2016 года, и тогда в базе данных системы было лишь 70 млрд фактов.

Как и Knowledge Graph, поисковая система Diffbot постоянно просматривает миллиарды веб-страниц. Однако стартап использует поисковый индекс не для того, чтобы дать людям наиболее релевантные ссылки на информацию: Diffbot предоставляет компаниям данные, которые они могут затем интегрировать в свои собственные аналитические инструменты.

Diffbot привлек финансирование на сумму $12 млн и смог обзавестись несколькими именитыми клиентами, вроде Salesforce, eBay, Snapchat и Intel. В прошлом году доходы компании составили почти $5 млн. По мнению Тана, продажи вскоре могут удвоиться, поскольку все больше компаний находится в поиске крупномасштабных баз данных.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Назад в будущее: почему IT-гиганты стали инвестировать миллиарды в атомную энергию Назад в будущее: почему IT-гиганты стали инвестировать миллиарды в атомную энергию

Почему корпорации ищут спасение «старом» атоме и причем тут ИИ?

Forbes
6 фактов о здоровых отношениях, которые полезно знать 6 фактов о здоровых отношениях, которые полезно знать

Как отличить здоровые отношения от представлений о них

Psychologies
Операторы просят отложить вступление в силу новых правил продажи сим-карт иностранцам Операторы просят отложить вступление в силу новых правил продажи сим-карт иностранцам

Операторы попросили отложить новые требования по продаже сим-карт

Forbes
На пути к «умному» производству На пути к «умному» производству

Лидеры российской металлургии внедряют передовые решения мирового уровня

Эксперт
5 советов, как отключить голову во время секса 5 советов, как отключить голову во время секса

Как перестать думать о неважном и начать чувствовать?

Psychologies
Блокчейн больше не будущее. Как крупнейшие компании мира уже используют технологию Блокчейн больше не будущее. Как крупнейшие компании мира уже используют технологию

Блокчейн уже не просто слово из будущего

Forbes
Cоосновательница кулинарной школы Novikov School Юлия Митрович о секретах успеха Cоосновательница кулинарной школы Novikov School Юлия Митрович о секретах успеха

Как хобби вдохновило Юлию Митрович на открытие собственного дела

Cosmopolitan
Летняя смена Летняя смена

Если ты решилась отправить ребенка на отдых в лагерь, волнений не избежать

Лиза
Пошли по кривой. Почему зарплаты в России падают раньше, чем в Европе Пошли по кривой. Почему зарплаты в России падают раньше, чем в Европе

В России пик заработной платы приходится на 35-40 лет. Почему так происходит?

Forbes
Как не надо флиртовать с девушками в сети: 8 самых частых ошибок Как не надо флиртовать с девушками в сети: 8 самых частых ошибок

Чего стоит избегать в кокетливой переписке с понравившейся девушкой

Playboy
Огонь «Базилики»: рождение сверхмощной артиллерии Огонь «Базилики»: рождение сверхмощной артиллерии

Как нехватка небольшой суммы денег привела к уничтожению Византии

Популярная механика
Театр русской драмы Театр русской драмы

Нашим женщинам вроде бы положено страдать

Cosmopolitan
Отрывок из автобиографии дочери Стива Джобса — летописи сложных отношений с отцом Отрывок из автобиографии дочери Стива Джобса — летописи сложных отношений с отцом

Фрагмент автобиографии Лизы Бреннан-Джобс: её детство было сложным

Esquire
11 способов избавиться от головной боли без таблеток 11 способов избавиться от головной боли без таблеток

От головной боли можно избавиться естественным путем

Playboy
Что мы думаем о финале «Игры престолов»? Ну нормально Что мы думаем о финале «Игры престолов»? Ну нормально

«Игра престолов закончилась. И знаете – мы это переживем.»

GQ
Смешная девчонка Смешная девчонка

Марго Робби о том, как освоиться в Голливуде и начать продюсировать фильмы

Grazia
Вырастить сына Вырастить сына

Нужна ли операция при «фимозе» или «гидроцеле» и можно ли предотвратить болезнь

Добрые советы
“Братство” — скандальный фильм Павла Лунгина, который пытались запретить. Рассказываем о других причинах его посмотреть “Братство” — скандальный фильм Павла Лунгина, который пытались запретить. Рассказываем о других причинах его посмотреть

Новый фильм Павла Лунгина, посвященный Афганской войне, вызвал большой скандал

Esquire
Кружево империи: секреты античных дорог Кружево империи: секреты античных дорог

Высококачественная дорожная сеть общей протяженностью в два земных экватора

Популярная механика
Подарок Путина. На кого рассчитана третья волна амнистии капитала Подарок Путина. На кого рассчитана третья волна амнистии капитала

Почему законопроекты об амнистии капитала не помогут российскому бизнесу

Forbes
Одри Хепбёрн: Есть вещи поважнее, чем кино Одри Хепбёрн: Есть вещи поважнее, чем кино

4 мая – 90 лет со дня рождения Одри Хепбёрн

Лиза
Дом Блэкаут: один из самых страшных аттракционов в мире Дом Блэкаут: один из самых страшных аттракционов в мире

Эксперимент, призванный нащупать, где проходят границы человеческого страха

Cosmopolitan
Легенда о Чернобыльском «эксперименте»: что на самом деле произошло на АЭС и зачем в СССР соврали о причине катастрофы, предсказанной конструкторами Легенда о Чернобыльском «эксперименте»: что на самом деле произошло на АЭС и зачем в СССР соврали о причине катастрофы, предсказанной конструкторами

6 мая 2019 года канал НВО начал показ сериала «Чернобыль»

Esquire
Клеточный автомат: возможна ли автоматическая жизнь? Клеточный автомат: возможна ли автоматическая жизнь?

Мир Minecraft затягивает, ведь он живет и эволюционирует

Популярная механика
Семь аудиокниг, которые заставят ваш мозг работать по-другому Семь аудиокниг, которые заставят ваш мозг работать по-другому

Аудиокнига — отличный способ немного отдохнуть и разгрузить голову

Forbes
Почему мы разочаровываемся в партнерах Почему мы разочаровываемся в партнерах

Почему мы так часто выбираем «не тех» и испытываем острое разочарование и боль

Psychologies
Перехват: секреты и тайны спецслужб США Перехват: секреты и тайны спецслужб США

Подлинные жемчужины рассекреченных архивов Агенства национальной безопасности

Популярная механика
Самые молодые участники рейтинга Forbes «30 до 30» Самые молодые участники рейтинга Forbes «30 до 30»

Девятка самых юных участников рейтинга 30 перспективных россиян моложе 30 лет

Forbes
Бумажка вместо навыков: почему онлайн-образование не подготовит лидеров будущего Бумажка вместо навыков: почему онлайн-образование не подготовит лидеров будущего

Онлайн-курсы воспитывают людей с искаженным представлением о профессионализме

Forbes
Напряжение растет Напряжение растет

Последние два десятка лет автомобили эволюционируют с невероятной скоростью

АвтоМир
Открыть в приложении