Читать книгу «Новое SEO-2.0 без ключевых слов. Как вывести сайт на вершину поисковой выдачи?» онлайн полностью📖 — Анатолия Владимировича Косарева — MyBook.

RANKBRAIN (искусственный интеллект)

RankBrain – так назвал Google системы искусственного интеллекта с машинным обучением, которая помогает Google понять смысл запросов и предоставлять наиболее подходящие результаты поиска в ответ на эти запросы сообщило агентство Bloomberg. Это подтвердил и Google.

Машинное обучение – это компьютерная программа, которая учит саму себя.

Истинный искусственный интеллект, – это то, где компьютерная программа пополняет свою базу знаний, как от обучения, так и от накопления знаний и создания новых связей.

Чтобы у вас не было иллюзий о бескрайних возможностях искусственного интеллекта, рассмотрим простые примеры.

Классический пример, чем отличается кошка от собаки.

Как искусственный интеллект по картинке отличит кошку от собаки? Первоначально создается база из десятка тысяч изображений кошек и собак. Затем, каждое изображение делится на фрагменты:

нос, рот, уши, лапы, и т. д. и т. п.

Каждому такому фрагменту присваивается кодовое число, которое относится к группе кошек, и группе собак.

При определении кошка или собака изображены на исследуемой картинке, изображение делится на такие же фрагменты. Полученные фрагменты сравниваются с теми, что в базе, и подбираются наиболее похожие.

Из ста анализируемых фрагментов оказалось, что 89 похожи на собаку, а 11 – на кошку. Искусственный интеллект выдает решение, что это – собака.

Если искусственный интеллект определил вид животного правильно, то всем фрагментам присваивается кодовое число, данные заносятся в базу данных, и вся система этого интеллекта – обучилась.

Но не всегда проходит так гладко, поэтому перед запуском систему проходят проверку.

Если искусственный интеллект ошибся, то системе «говорят», что она ошиблась. Новые данные заносятся с правильными кодовыми числами.

В Google тестированием работы интеллекта занимаются специально обученные люди, которые проверяют работу алгоритма. Поэтому иногда можно видеть, что вдруг какой-то непонятный сайт оказался выше хороших сайтов. Но как правило это временно. Ручная проверка сайтов происходит постоянно, и в результате всегда слабые сайты занимают в конечном итоге соответствующее место.

О методики ручного тестирования сайтов, и как этот метод применить к оценке сайтов конкурентов читайте в книге «5000+ сигналов ранжирования в поисковиках». Эта книга – прекрасное руководство оценки сайтов с целью понять, что нужно сделать своему сайту, чтобы обойти конкурентов в поисковой выдаче.

Но продолжим о работе искусственного интеллекта.

Разберем еще одну несложную задачу. Предположим, что в базе данных есть сто авторов, и каждого автора имеется в базе данных по десятку книг. Требуется по тексту, или фрагменту из книги неизвестного автора определить, кто же написал этот текст. Разумеется, исследуемого фрагмента текста нет в базе данных.

Здесь в программе подготовлено, какими словами, как часто, и в каких сочетаниях пользовался каждый автор. Анализируя тестируемый текст, программа определяет, к какому автору ближе всего это сочетание. К кому ближе, того и называет эта программа.

По этому же принципу Google определяет качество текста.

Поисковик имеет базу данных слов (из самых авторитетных сайтов в этой отрасли), которые должны быть в тексте по этой теме, и ищет их в исследуемом тексте.

Чем больше совпадений, по словам, употреблённых в текстах, с самыми лучшими веб-страницами, тем выше качество исследуемой.

И ещё.

Представьте, что компьютерная программа поможет вам выбрать фильм, который понравится вам. Первоначально программа на вашем экране показывает названия всех имеющихся у неё фильмов.

Программа еще не знает ваших предпочтений, и вы отмечаете, из уже виденных фильмов какие вам не нравятся, перетягивая их в левую сторону. Те же фильмы, которые вы видели, и они вам понравились – в правую. Так фильмы условно распределяются по виртуальной шкале от не понравившихся фильмов к тем, которые понравились.

Чем больше фильмов вы расставите на виртуальной шкале, тем более точным будет предложение о новом просмотре. С каждой новой отметкой программа, самообучаясь, дает более точное предсказание.

Так и искусственный интеллект Google и других поисковиков помнит, что прежде искал пользователь, оценивает, и предлагает наиболее подходящее.

Это особенно полезно, когда пользователь вводит не конкретный запрос.

Например, пользователь в строке поиска ввел одно слово: «кухня». Что он имел ввиду?

Сериал Кухня, мебель для кухни, или кухни народов мира?

Если пользователь прежде искал сериалы, то первыми в поиске будут сериалы. Если искал рецепты, то будут – рецепты…

Сейчас уже искусственный интеллект способен, по сотни отметок нравится узнать, о вас больше, чем ваш сосед. По 200 лайкам узнает о вас больше, чем ваш (а) спутник (ца) жизни. Проанализировав 500 лайков, программа узнает о ваших предпочтениях лучше, чем вы сами. А сколько вы уже поставили лайков?

RankBrain – это часть общего поискового «алгоритма» Google, компьютерной программы, которая используется для сортировки миллиардов страниц, о которых она знает, и поиска наиболее подходящих для конкретных запросов.

RankBrain является частью алгоритма поиска Hummingbird от Google.

Hummingbird – это общий алгоритм поиска. Так же, как у автомобиля есть двигатель. Сам двигатель может состоять из различных частей, таких как масляный фильтр, топливный насос, радиатор и так далее. Так, Hummingbird включает в себя различные части, причем RankBrain является одним из новейших.

Потому что RankBrain не обрабатывает весь поиски, как это делает общий алгоритм. Он берет уже подготовленные для него сигналы, и только с ними работает.

Дэнни Салливан журналист и аналитик, который занимается исследованием в области цифрового и поискового маркетинга утверждает, что RankBrain является третьим по важности сигналом при ранжировании сайтов в ответах на запросы пользователей.

Первым пока остаются ссылки, которые Google подсчитывает в виде голосов. Яндекс же стал намного меньше выделять веса под ссылки.

Вторым сигналом он предполагает – «слова», где слова охватывают все – от слов на странице до того, как Google интерпретирует слова, которые люди вводят в окно поиска вне анализа RankBrain.

Третьим по значимости сигналам считается RankBrain, который в основном используется для интерпретации запросов. Люди вводят фразы в строку поиска, чтобы найти страницы, которые могут не содержать точных слов, которые искали.

Использование LSI-терминологии.

Например, если прежде человек в строке поиска вводил «Обувь», то Google отбирал на веб-страницах не только «Обувь», но и обуви, обувью, и подобные.

Теперь если пользователь ввел, «Обувь», то поисковик предложит и другие варианты: «туфли», «ботинки», «сапоги», «босоножки» и многое другое.

Люди часто сетевой адаптер для ноутбука называют зарядным устройством, зарядкой, и т. п. Google знает все варианты, и в результатах поиска выводит все варианты. Смотрите скриншот.


Как видите, Google понял, что пользователь хочет найти, и предложил лучшие ответы, не взирая, на введенные слова.

Или более интеллектуальный поиск. Я ввел фразу «жена президента сша» с ошибкой



Но Google понял, что я имел ввиду. Google знает, что жена и супруга – слова синонимы. Google предположил наиболее вероятно, что меня интересуют супруги действующего президента, и вывел их первыми. Следующим результатом показал Меланью Трамп. И только после этого вывел список первых леди США.

Прошло время после первого издания этой книги, президент поменялся, и поисковик на это правильно отреагировал.



Не правда ли, замечательная работа Google RankBrain? Так работает искусственный интеллект Google.

Как RankBrain помогает честным авторам?

Некоторое время назад одному заводу мы создавали 2 сайта: для главного завода и его филиала, территориально расположенные неподалёку друг от друга. Для главного завода главный инженер, доктор наук изъявил желание написать несколько ключевых текстов. Филиалу мы писали статьи сами. Получилось некоторое соревнование: чьи статьи Google будет позиционировать выше.

Как вы думаете, кто победил: первоклассный копирайтер, использующий во всей мощи LSI-терминологию, или доктор наук?

Победил доктор наук.

При всех равных условиях его статьи в подавляющем большинстве позиционировались первыми, а статьи копирайтера – вторыми. Почему?

Потому что доктор наук знал лучше терминологию и описываемый процесс, чем копирайтер. Доктор наук использовал большее количество синонимом, и связанных с ними слов. Правда, я лично проконсультировал главного инженера по основным положениям написания высоко ранжируемых статей, и потом мы расставили все теги и атрибуты, в соответствии с требованием поисковиков.

Поясню на примере. Предположим, нужно написать статью, в которой рассказывается о демонстрации нового фильма в кинотеатре. Google мало иметь в статье слова кинотеатр и фильм. Ему нужны и сопутствующие слова, например, билеты, аншлаг, цена, и другие слова, которые обычно употребляются в обычной речи.

Чем больше таких слов, тем Google считает, что тема раскрыта более полно.

Законный вопрос: откуда Google знает, какие синонимы, термины и сопутствующие слова соответствуют не только всей теме, но и конкретному запросу. Не забывайте, что есть искусственный интеллект, со своей первоначальной базой.

И далее в Google индексе сотни миллиардов страниц (а может и больше), и, анализируя эти страницы, искусственный интеллект постоянно пополняет эту базу данных.

Если Google видит, что с набором определенных групп слов станица пользуется у посетителей популярностью, её цитируют, то из таких страниц и выбираются дополнительно LSI-фразы, и пополняют базу данных.


Более сложный процесс ранжирования сайтов, когда длинный запрос (такие запросы называются запросами с длинным хвостом), и никогда прежде не вводился.

Проблема в том, что Google обрабатывает почти четыре миллиарда запросов в день. В 2007 году Google заявил, что до 25 процентов этих запросов никогда раньше не видел. В 2013 году эта цифра снизилась до 15 процентов, о чем сообщал Bloomberg, и Google подтвердил это. А к концу 2021 года таких запросов осталось 13%.

Но 13 процентов из 4 миллиардов – это по-прежнему огромное количество запросов, которые никогда не вводил ни один человек. Это почти пол миллиарда новых запросов в день.

Среди них могут быть сложные запросы, состоящие из нескольких слов, которые также называются «длинными хвостами».

RankBrain разработан, чтобы помочь лучше интерпретировать эти запросы, чтобы найти лучшие страницы для поисковика.

Как утверждает Google, он может улавливать закономерности между, казалось бы, не связанными сложными запросами, чтобы понимать, насколько они на самом деле похожи друг на друга. Это самообучающая программа, в свою очередь, позволяет лучше понять будущие сложные поиски, и их связь с конкретными темами. Самое главное, исходя из того, что Google сообщил нам, он может затем связать эти группы поиска с результатами, которые, по его мнению, понравятся пользователям.

Google не предоставляет примеры групп поиска и не даёт подробных сведений о том, как RankBrain угадывает, какие страницы являются лучшими. Но последнее, вероятно, объясняется тем, что, если он может перевести неоднозначный поиск во что-то более конкретное, он может затем ранжировать и выводить лучшие ответы.

Я сделал такое длинное описание, что бы было понятно, что какой-то прыщавый копирайтер не получит высокой оценки за свою работу после анализа его статьи Google RankBrain, если в ранжировании учувствуют специалисты из области, в которой мальчик написал статью.

Но хорошо подготовленный специалист в своей статье раскроет тему так, что его статья будет высоко позиционироваться по нескольким ключевым фразам. Google RankBrain, как хороший специалист видит уровень написанного текста. Да он не понимает текст, а поэтому прыщавый копирайтер уже не может навешать ему лапшу на уши.

Алгоритм Google BERT

BERT: Сравнительно новый алгоритм Google, который обещает революцию в поисковой выдаче

Google уже стал настолько сложной частью жизни людей, что многие из нас общаются непосредственно с ним.

Пользователи делают запросы: «как мне попасть на рынок» или «когда начнется весна», как будто они естественно разговаривают с человеком. Но стоит помнить: Google состоит из алгоритмов, которые упакованы в фильтры.

И это один из тех алгоритмов – Google BERT – который помогает поисковой системе понять, о чем просят люди, и дает ответы, которые они хотят.

Правильно: боты не люди, но технологии настолько продвинулись вперед, что могут понимать человеческий язык, включая сленг, ошибки, синонимы и языковые выражения, присутствующие в нашей речи, а мы даже не замечаем.

Этот новый поисковый алгоритм был создан Google, чтобы лучше понимать поисковые намерения пользователей и содержание веб-страниц.

Но как это работает? И как это влияет на ваши стратегии SEO?

Давайте все сейчас разберемся:

Что такое Google BERT?

Google BERT – это алгоритм, который улучшает понимание человеческого языка поисковой системой.

Это важно во вселенной поиска, поскольку люди спонтанно выражают себя в поисковых запросах и содержании страниц, а Google работает над тем, чтобы найти правильное соответствие между одним и другим.

BERT – это аббревиатура от Bidirectional Encoder Representations from Transformers (двунаправленных представлений кодировщика от трансформеров). Сбивает с толку? Давайте объясним это лучше!

1
...
...
14