Что такое граф знаний
Knowledge Graph или граф знаний – семантическая сеть, в которой хранится информация о разных сущностях и взаимосвязях между ними. Сущностью или «узлом» графа может быть что угодно: человек, предмет, дата, концепция и любой другой материальный объект или абстрактное понятие. Предикаты или «ребра» отражают взаимосвязи и отношения между разными сущностями в графе. Например, Альберт Эйнштейн и город Ульм в Германии – две самостоятельные сущности, а тот факт, что Эйнштейн родился в Ульме – будет уже предикатом.
Виды графов знаний и их применение
Knowledge Graph помогают связать большое количество данных из разных источников в одну общую коллекцию знаний. Они могут быть общими, то есть хранить информацию о разных видах данных, и специализированными – фокусироваться на какой-то одной предметной области. Например, Wikidata – один из самых крупных графов знаний – хранит разностороннюю информацию. А BioPortal – крупнейший специализированный граф с более чем 140 млрд фактов о биотехнологиях и медицине. Эти графы находятся в открытом доступе и доступны для всех пользователей Интернета. Число открытых Knowledge Graph в интернете растет, все вместе они образуют облако семантически связанных друг с другом данных – Linked Open Data Cloud. Вот здесь можно посмотреть интерактивную карту открытых графов знаний различной тематики.
Графы знаний бывают и закрытыми, разработанными для решения задач конкретной сферы или предприятия. На основе этих данных работают поисковики, например, Google, голосовые помощники – Siri от Apple и Alexa от Amazon и чат-боты. Knowledge Graph могут быть источником пользовательских предпочтений, благодаря которым стриминговые платформы и сайты выстраивают качественные рекомендательные системы.
Графы знаний могут также содержать финансовую, правовую, производственную информацию о компании и помогать структурировать и анализировать опыт предприятия, предсказывать риски и контролировать производство.
Песня, в которой пелось так…
На самом деле мы взаимодействуем с Knowledge Graph постоянно, например, когда спрашиваем что-то у поисковика. Пользовательские запросы зачастую направлены не на определенный объект, а на связанные с ним ассоциации. Если мы охарактеризуем героя как «маленький зеленый человек со световым мечом», Google поймет, что мы говорим о Йоде из «Звездных войн». А по запросу «фильм Стивена Кинга, где Николсон бухает, печатает книгу и ломает дверь» Яндекс выдаст нам «Сияние» (другие интересные запросы можно найти в исследовании Яндекса).
В этом случае мы ищем сущность (фильм или героя), указывая лишь на связь с ним. Правильно угадывать такие пользовательские запросы поисковикам помогает как раз Knowledge Graph. А еще он формирует целый ряд дополнительных сущностей (различные рекомендации, например, другие фильмы с Николсоном), которые скорее всего нас заинтересуют.Графы знаний описывают объекты с высокой точностью, но при этом не всегда полно. В некоторых случаях алгоритмы могут срабатывать неверно. Подробнее эту тему мы обсуждали в пятом выпуске подкаста СБъ «Неопознанный Искусственный Интеллект». Вы можете послушать эпизод на Яндекс.Музыке или прочитать расшифровку выпуска здесь.