- Старая паутина С девяностых по настоящее время никто не мог предсказать успех сети (даже если сегодня...
- Что такое сущность?
- Почему объекты более эффективны, чем ключевые слова?
- Метаданные: данные, описывающие данные
- Разметка схемы: золотой стандарт семантической паутины
- Что такое структурированные данные?
- Почему JSON-LD формат, используемый для структурированных данных?
- Почему связанные данные так важны?
- Как я могу связать сущности друг с другом?
- Почему важно публиковать 5-звездочные открытые данные?
- Как вы можете связать сущности с вашего сайта WordPress с Связанным открытым облаком данных?
- Соотнесите все благодаря графу знаний
- Подводя итоги ...
Старая паутина
С девяностых по настоящее время никто не мог предсказать успех сети (даже если сегодня мы воспринимаем это как должное). Сегодня более миллиарда сайтов превращают сеть в неразрывную сеть контента. Менее чем за двадцать лет количество сайтов выросло в геометрической прогрессии.
Всего двадцать лет назад сеть, тогда еще находившаяся в зачаточном состоянии, включала миллионы страниц. Тим Бернерс-Ли почувствовал, что может связать эти страницы с тем, что мы все знаем сегодня как гипертекст .
Тем не менее, веб-серфинг по-прежнему ограничен, потому что вы можете переходить с одной страницы на другую по ссылкам. Поэтому усилия, необходимые для поиска того, что вы ищете, были огромными. В то время, воображая, что поисковая система, такая как Google, может ответить на ваши вопросы, была научной фантастикой.
По этой причине многие блестящие умы отважились искать более интуитивный способ поиска веб-страниц, содержащих ответы на наши вопросы. Наконец, в 1998 году два мальчика из Стэнфорда создали алгоритм под названием PageRank .
Алгоритм был основан на механизме цитирования, используемом учеными в своих исследованиях. На самом деле, в академическом мире цитирование документа немного похоже на голосование за авторитетность самого документа. Фактически, PageRank заменил ссылки на цитаты. Эти гипертекстовые ссылки с одного текста на другой действовали в качестве положительного голоса, что увеличивало рейтинг сайта-получателя. Что каждый в мире SEO сегодня знает как обратную ссылку .
Так появился Google.
Короче говоря, чем выше качество обратных ссылок, полученных с веб-сайта, тем выше шанс получить более высокий балл в поисковой выдаче (результаты поиска Google). Обратные ссылки по-прежнему являются основой Интернета; что держит его вместе Однако на этом позвоночнике расцвела новая сеть.
Новый веб
В 2012 году футурист Рэй Курцвейл прибыл в Google с миссией: заставить поисковую систему понимать человеческий язык. С этой целью в 2013 году Google обновил свой алгоритм, введя анализ естественного языка с помощью Hummingbird, и в 2015 году дал дополнительный импульс в этом направлении с помощью искусственного интеллекта RankBrain.
Короче говоря, семантика стала ключевым исследовательским фактором . Это была революция!
Фактически, среди более чем 200 факторов, которые Google исследует для оценки позиционирования страницы, есть также искусственный интеллект, используемый для классификации и лучшего понимания поисковых запросов пользователей и поиска соответствующего контента на веб-странице.
Это означает, что на стороне пользователя Google развернул огромные ресурсы, чтобы сделать поиск более мощным. Алгоритм Google всегда лучше при чтении того, что стоит за поиском. Чтобы понять намерения пользователя.
Проведенный до настоящего времени анализ учитывает результаты исследования. С другой стороны, как создатель контента, веб-менеджер, SEO-эксперт или кто-либо другой, пишущий в Интернете, может сделать так, чтобы их контент легко интерпретировался поисковой системой?
Ответ в том, что в контексте семантическая паутина определяется объект , Объекты организованы в виде графиков знаний, которые Google использует с 16 мая 2012 года для классификации части своей базы знаний. Вас смущают все эти новые термины? Сущности, графы знаний и метаданные являются основой семантической сети.
В конце этого прочтения вы будете иметь в виду, что они собой представляют, для чего они нужны, и почему они необходимы для того, чтобы стать частью революции, которая происходит сегодня в сети!
Что такое сущность?
по Википедия :
Они представляют классы объектов (фактов, вещей, людей, ...), которые имеют общие свойства и автономное существование для целей применения интереса. Вхождение объекта - это объект или экземпляр класса, который представляет объект. Здесь нет упоминания о значении, которое идентифицирует объект, но о самом объекте. Интересным следствием этого факта является то, что вхождение сущностей существует независимо от связанных с ним свойств. В этом ER-модель заметно отличается по сравнению с реляционной моделью, в которой мы не можем представить объект, не зная некоторых его свойств.
В семантической сети сущность - это объект, описанный в документе. Благодаря этому вы позволяете компьютерам понимать все, что вы знаете о человеке, организации или месте, упомянутом в документе.
Все эти факты организованы в декларации - известные как тройки - которые выражены в форме субъекта, предиката и дополнения объекта (например: я Дженнаро , Дженнаро знает Андреа ).
Почему объекты более эффективны, чем ключевые слова?
По трем простым причинам. Объектами являются:
- соединенный
- устранять неоднозначность
- контекст
Посредством сущностей создаются значимые отношения, которые могут быть прочитаны, поняты и интерпретированы поисковыми системами. Это то, чего позволяет достичь семантическая SEO. Сущности в контексте семантической сети - это фактически данные, которые компьютеры могут использовать для анализа и интерпретации человеческого языка. Но если сущности - это определенные объекты или вещи, независимо от контекста, как они приобретают контекст?
Нам нужны метаданные!
Метаданные: данные, описывающие данные
В самом простом определении метаданные - это данные, описывающие другие данные. Концепция метаданных не нова. На самом деле библиотекари давно используют их для управления и поиска документов. Представьте, что вы тщательно классифицировали каждый свой документ на основе автора, даты публикации, длины и т. Д. Эта классификация позволяет легче находить документы.
Для правильного функционирования метаданные должны следовать классификационной логике, которую все понимают. Короче говоря, должен быть набор правил, стандарт, которому должен следовать каждый, чтобы система работала. Как и в грамматике, в которой грамматические правила эволюционировали, чтобы создать стандартный язык.
Онтологии являются основой метаданных. Самая простая форма онтологии - это словарный запас. Словарь, который делает возможным семантическое SEO, называется schema.org.
Разметка схемы: золотой стандарт семантической паутины
На практике основой семантической сети является открытый и общий словарь, управляемый сообществом открытого исходного кода и используемый вместе с другими словарями и онтологиями. Как и в языке, где отсутствие стандартных грамматических правил затрудняет, если не делает невозможным общение, семантическая сеть не была бы здесь без золотого стандарта .
Совокупность общепризнанных правил, которые делают основы этой новой сети прочной. Ну, Schema.org - это золотой стандарт семантической сети. Действительно, из всех конкурирующих стандартов Schema.org был первым словарём с открытыми связанными данными, введенным для коммерческих целей (помогая коммерческим поисковым системам, таким как Google, организовать сеть и улучшить качество результатов).
Сегодня в мире насчитывается 617 открытых словарей. Эти словари могут быть объединены для организации и структурирования различных областей знаний. Schema - это словарь, который преобладал над другими, потому что он оказался более эффективным (или мы могли бы сказать, что принятие schema.org основными поисковыми системами в мире, повысило его эффективность - немного похоже на проблема яйца и курицы).
При добавлении разметки или схемы разметки схемы к веб-страницам контент становится серией связанных данных, которые открывают множество возможностей!
Что такое структурированные данные?
Структурированные данные - это стандартизированный формат, который позволяет предоставлять информацию о веб-странице, чтобы ее содержание было классифицировано и стало доступным для поисковых систем.
Например, если вы публикуете рецепт « Сицилийской аранцины », вам нужно будет указать ингредиенты, время приготовления и тип кухни. Короче говоря, вам нужно будет объяснить поисковику, что рецепт состоит из одного килограмма. риса, 2,5 литра воды, 100 грамм масла и так далее. Благодаря структурированным данным вы можете освободить место для этой информации и сделать ее, наконец, понятной для поисковой системы.
Сегодня schema.org может быть встроен в веб-страницы в трех форматах:
Представьте себе книгу, поддерживаемую в трех разных форматах: электронная книга, мягкая обложка и твердый переплет. У всех разные веса, размеры и тд. Аналогично, schema.org может быть реализован в трех перечисленных выше форматах.
Хотя лучшего формата не существует, JSON-LD является предпочтительным форматом Google. Фактически это JavaScript, встроенный в тег в заголовке или в теле веб-страницы. Код содержит полезную и контекстную информацию о статье, передаваемую через стандарт связанных данных.
Связанные открытые данные выражаются в JSON-LD в соответствии со структурой простых троек. В этот момент вы спросите себя: « Почему JSON-LD, а не другие форматы? "
Почему JSON-LD формат, используемый для структурированных данных?
Преимущества использования JSON-LD следующие:
- Это не влияет на производительность веб-страницы или сайта, поскольку он загружается асинхронно
- Он внедряется в страницу, не затрагивая структуру и существующие теги HTML
- Его легко использовать веб-разработчикам, поскольку он соответствует синтаксису JSON.
Последнее также является причиной, по которой Google рекомендует владельцам веб-сайтов использовать структурированные данные на веб-странице в форме JSON-LD. Этот формат позволяет связывать сущности, следовательно, имена и понятия.
Однако эта информация все еще может быть неоднозначной. Например, представьте случай, в котором мы говорим о Лигабуэ. Не певец, а итальянский художник начала ХХ века. Еще раз, связанные данные смогут сообщить поисковой системе, с которой Ligabue говорит, благодаря контексту, созданному самими данными.
Почему связанные данные так важны?
Подводя итог сказанному, schema.org - это словарь, который помогает поисковой системе понять содержание веб-страниц. Связанные данные - это метод публикации структурированных данных с использованием словарей в качестве Схемы. Эти словари могут быть связаны друг с другом и, следовательно, интерпретироваться машинами.
Используя связанные данные, информация, закодированная в тройках, может распространяться на разных сайтах. На сайте A мы можем показать, что сущность Andrea (человек) знает Francesco (человека), который был описан на сайте B.
Таким образом, данные, представленные на двух разных сайтах, становятся взаимосвязанными.
Семантические плагины, такие как WordLift, могут автоматически связывать одну сущность с другой, читая метаданные, содержащиеся на странице. Но как вы можете быть уверены, что поисковая система понимает эти страницы однозначно?
Есть два способа:
- неявно, поисковая система может понять, что на веб-сайте мы с большей вероятностью будем говорить о художнике Ligabue, потому что это сам контекст, описываемый через инфраструктуру метаданных, чтобы сообщить об этом в Google (через векторы, которые с определенной степенью вероятности сигнализируют, что это правильный смысл, который будет приписан)
a) чтение атрибута связанных данных с именем @id (уникальный идентификатор объекта, который уже может быть известен поисковой системе) или
б) чтение любой ссылки SameAs для объекта, которая указывает на известный набор данных. Цель этих ссылок - сообщить машине, что объект эквивалентен другому объекту в открытой энциклопедии, такой как Википедия, или непосредственно в Графе знаний Google.
Как я могу связать сущности друг с другом?
Schema.org определяет свойство sameAs следующим образом:
URL-адрес справочной веб-страницы, который четко указывает на идентичность объекта. Например, URL-адрес страницы Википедии того же объекта, запись в Википедии или официальный сайт.
Это все равно что сказать поисковой системе: «это то же самое, что вы найдете по этому адресу». Сегодня это свойство мало используется в Интернете: по оценкам, оно присутствует в ряде доменов от 10000 до 50000. Вот почему, используя его, вы действительно можете отличить свою стратегию SEO от конкурентов.
Однако свойства sameAs недостаточно, если вы хотите иметь возможность запрашивать данные, которые вы публикуете (или, если, возможно, вы хотите обмениваться данными с другими наборами данных).
Как только эта точка достигнута, нам нужно сделать еще один шаг. Этот шаг состоит в публикации данных по схеме 5 звезд, связанных открытыми данными, введенными Бернерсом-Ли, которая требует связи каждой информации с другими данными.
Здесь вступает в игру свойство owl: sameAs .
Почему важно публиковать 5-звездочные открытые данные?
При публикации данных в Интернете следует соблюдать четыре простых принципа (и да, структурированные данные - это открытые данные, поскольку они полностью доступны).
- Используйте URI для идентификации сущностей
- Используйте HTTP URI, чтобы пользователи могли искать эти объекты (это означает, что идентификатор каждого объекта должен быть доступен через HTTP URI)
- Публикация данных с использованием стандарта связанных данных, называемого RDF
- Включите ссылки на другие URI, чтобы данные можно было дополнить дополнительной информацией (и - опять же, поэтому нам необходимо добавить свойство owl: sameAs ).
Чтобы упростить, набор открытых данных с пятью звездочками - это способ публикации метаданных, делающий их читаемыми и доступными для компьютеров.
Вот почему, связывая текст, написанный человеком с открытым набором данных, наше содержимое становится полностью доступным и совместимым с машинами.
Другими словами, семантическое SEO заключается в том, чтобы помочь машине понять наш контент, используя открытый веб-стандарт для его описания.
Некоторые из наборов данных, которые используют открытые данные, связанные с 5 звездами, являются фундаментальными краеугольными камнями для алгоритмов семантической поисковой системы, таких как Google и Bing, и, в каскаде, для личных цифровых помощников, таких как Alexa, Cortana и Google Assistant.
Эти наборы данных (например, DBpedia, Wikidata, Geonames и другие) связаны между собой и вместе образуют связанное облако открытых данных.
Когда вы добавляете структурированные данные на свой сайт в WordPress с помощью плагина, такого как WordLift, структурированные данные публикуются как открытые данные. На практике ваш веб-сайт WordPress и метаданные о вашем контенте становятся частью Linked Open Data Cloud.
Как вы можете связать сущности с вашего сайта WordPress с Связанным открытым облаком данных?
Представьте, что вы хотите объяснить поисковику, кто такой Мэтт Малленвег, связав его страницу с моим блогом с его сущностью в Cloud LOD. Как мне сделать это на моем WordPress?
Как вы можете видеть выше, я использовал WordLift внутри моего WordPress для создания страницы на Мэтта Малленвега. Эта страница установлена как Персона , как тип объекта схемы. Чтобы выяснить, о ком я говорю, я выполняю поиск с использованием WordLift, который рисует на гигантских графиках, опубликованных в LOD, и через мгновение я получаю ссылку на сущность Мэтта Малленвега в Freebase, Wikidata и DBpedia.
После обновления страницы свойства схемы sameAs и owl: sameAs автоматически добавляются WordLift и становятся доступными для поисковых систем.
Теперь давайте попробуем использовать инструмент структурированного тестирования Google, чтобы узнать, как поисковая система видит страницу:
Структурированные данные были созданы без написания одной строки кода, и теперь Google может сканировать и индексировать эту страницу намного эффективнее. Однако есть и кое-что еще.
Как мы видели ранее, используя открытые данные, связанные с 5 звездами, мои данные становятся совместимыми с другими наборами данных, а также публикуются вне моей веб-страницы в графе знаний на основе RDF.
Соотнесите все благодаря графу знаний
В контексте семантической сети граф знаний является формой представления знаний. Он начинается с определения некоторой тройки, а затем эти тройки соотносятся для построения графа. Например, давайте поближе познакомимся - используя технологии семантической сети - со знаменитой сущностью Мэтта Малленвега в моем блоге:
Как вы видите, у нас есть серия троек, которые рассказывают нам историю: Мэтт Малленвег, полное имя которого Мэтью Чарли, родился в Хьюстоне, учился в Хьюстонском университете и является предпринимателем.
График знаний не говорит на каком-либо конкретном языке. Язык человеческий; в то время как граф знаний выражается в связанных открытых данных, следовательно, на языке машин.
Представьте, что весь ваш сайт описан большим графом знаний, состоящим из всех метаданных, которые описывают темы, о которых вы пишете. Этот граф знаний становится частью большего графа, который составляет и описывает новую сеть. Это истинная сила семантической паутины.
Подводя итоги ...
В этой статье мы увидели, что семантическая сеть здесь. Некоторые уже начали использовать семантические технологии в области цифрового маркетинга. Результаты чрезвычайно многообещающие с точки зрения SEO и находимости. Мы видим новую ветвь SEO, широко известную как семантическое SEO.
Несмотря на то, что обратные ссылки по-прежнему являются основой Интернета, ключевые слова становятся все менее актуальными и менее значимыми в будущем. Семантическая SEO позволяет вам структурировать контент по основным темам для вашего сектора и определять контекст, используемый поисковыми системами для классификации вашего контента на основе конкретных исследовательских целей.
Данные кодируются в свойствах, определенных в ряду свойств, определенных schema.org.
Добавление связанных данных на ваш сайт в WordPress с помощью плагина, такого как WordLift, означает публикацию структурированных данных, которые могут быть быстро прочитаны и понятны поисковыми системами. Из этих связанных данных машины могут экстраполировать отношения и контекст или, иначе говоря, аргументы и значения.
Когда структурированные данные публикуются в графе знаний с использованием стандартов семантической сети, ваш веб-сайт попадает в облако связанных открытых данных. Быть частью семантической сети означает сделать ваши данные доступными для компьютеров и позволить им анализировать их, чтобы предоставлять пользователям более качественный контент и, следовательно, повышать качество трафика, который они вам приносят.
Все это также означает нечто иное: публикуя данные, вы восстанавливаете контроль над своим контентом. Фактически вместе с содержимым вы также производите метаданные, необходимые для их сбыта и монетизации.
Это строительные блоки семантического SEO. Все, что вам нужно сделать, чтобы начать, это установить простой плагин WordPress.
Что такое сущность?Почему объекты более эффективны, чем ключевые слова?
Почему JSON-LD формат, используемый для структурированных данных?
Почему связанные данные так важны?
Как я могу связать сущности друг с другом?
Почему важно публиковать 5-звездочные открытые данные?
Как вы можете связать сущности с вашего сайта WordPress с Связанным открытым облаком данных?
С другой стороны, как создатель контента, веб-менеджер, SEO-эксперт или кто-либо другой, пишущий в Интернете, может сделать так, чтобы их контент легко интерпретировался поисковой системой?
Вас смущают все эти новые термины?
Что такое сущность?