53 фактора ссылочного ранжирования
- «Относительная частота слов запроса в ссылках (1 — слова запроса часто встречаются в ссылках, 0.3 — редко); если точнее, значение этого фактора пессимизируется при условии: TR=0 && LR=0 && (нет ни одной ссылки со всеми словами запроса) && (не прошёл кворум) && (в тексте встречается хотя бы одна пара слов запроса)»
- «В ссылках есть все слова запроса»
- «В одной ссылке есть все слова запроса»
- «Есть ссылка, прошедшая кворум»
- «Какая доля ссылок “хорошая”»
- «Насколько много “плохих” ссылок (плохой = dpr = 0)»
- «Максимальный dpr ссылки»
- «TfIdf обычный TF*IDF по ссылкам. Частота слова в ссылках умножается на обратную документную частоту и суммируется по всем словам, потом нормируется на длину документа.»
- «Есть точная форма всех слов запроса в тексте/линках»
- «Есть лемма всех слов запроса в тексте/линках»
- «Число ссылок, точно совпадающих с запросом»
- «Число обратное дисперсии временам появления ссылок со словами запроса»
- «Линковая релевантность с учетом тематичности»
- «Линковая релевантность с учетом качества каждой ссылки»
- «Линковая релевантность с учетом качества каждой ссылки и тематичности каждой ссылки»
- «Линковая релевантность с учетом некоммерческости каждой ссылки»
- «Линковая релевантность с учетом некоммерческости каждой ссылки, качества каждой ссылки и тематичности»
- «Процент входящих ссылок со словами запроса»
- «Процент слов запроса в ссылках (с точностью до синонима)»
- «В ссылках есть все слова запроса (с точностью до синонима)»
- «LR по парам слов запроса в обратном порядке»
- «LR по парам слов запроса через одно слово в текстах»
- «Средний возраст ссылок, внесших что-то в LR LinkAge=Min(log(средний возраст ссылки)/7, 1), за 1 принято 3 года»
- «LR с учетом совпадения языка ссылки и запроса и накрученности»
- «LR по отписанию в Яндекс.Каталоге»
- «Максимальный возраст значимого скопления ссылок, внесших что-то в LR»»Хост ранк по максимально выраженному слову запроса (обычно это название сайта)»
- «Доля входящих продажных ссылок. Реализован алгоритм распознавания коммерческих ссылок. Фактор ремапится на [0,1] если доля таких ссылок > 50%, иначе 0.»
- «Фактор CommLinksSEOHosts умноженный на NonCommercialQuery»
«Характеризует частоту слов в ссылках. Фактор большой, если слово, сыгравшее в линковой релевантности, редкое для ссылок.» - «Вес слов запроса, которые есть в линках»
- «Простой BM25 по точной форме в текстах ссылок»
- «LR по ссылкам из Яндекс.Маркета»
- «Дополнительные факторы про раскрученность сайта линковыми кольцами”
- «Линковая релевантность с пессимизацией за большой возраст линка»
- «Хостовые факторы, определяют сайты, накрученные линками — вторая и третья входящие степени”
- «Считали LinkQuality для этой страницы или нет (не считали, если ссылок мало)»
- «Количество различных внутренних ссылок на страницу»
- «Периодичность ссылок на сайт»
- «Количество почти-периодических ссылок»
- «Считает сумму вхождений следующего вида: последовательность слов запроса длиной больше двух, встретившихся в одной ссылке; нормировано на кол-во ссылок.»
- «Число входящих ссылок с морд»
- «Бинарный фактор, каждое слово запроса есть в тексте или в линках»
- «Отношение числа входящих ссылок, текст которых является URL, к числу всех входящих ссылок»
- «Количество входящих сео-треш ссылок между хостами»
- «Доля уникальных триграмм заголовка в триграммах ссылок»
- «Сумма максимальных значений SourceRank’ов для каждой входящей ссылки с учётом уникальности владельца.»
- «BM25 по текстам и линкам со спец. весами по уровню совпадения (форма, лемма, синоним)»
- «Вес слов запроса, которые есть в тексте в точной форме»
- «Позволяет оценить является ли документ ‘живым’ с точки зрения ссылок на него приходящих.»
- «Дисперсия количества слов запроса в ссылках.»
- «BM с затуханием по тексту каталожных ссылок.»
- «На данный урл есть ссылка из Infobox-ов в Википедии.»
- «Ранк качества текстов на хосте. Чем выше — тем больше вероятность того, что хост полон статей — рерайта, плохого копирайта, заказанного на биржах контента.
Все уже слышали, что в сеть слили код Яндекса, в том числе и список всех факторов ранжирования?
У Яндекса существует аналог Google RankBrain — MatrixNet. Яндекс использует PageRank.
Факторы ранжирования (позитивно):
- Возраст ссылок
- Трафик и % органического трафика
- Числа в URL-адресах
- Надежность хоста
- Меньше ошибок 40Х/50Х
- Ссылки на Википедию
- Возраст документа и последнее обновление
- Средняя позиция домена по всем запросам
- Обратная частота документа TF-IDF
Факторы ранжирования (негативно):
- Большое количество слешей в URL (негативный фактор)
- Ссылки с доменов .ua
- Не русский язык, так же машинный перевод.
Множество факторов ранжирования связано с пользовательским факторами: CTR, последний клик, время на сайте, показатель отказов.
Еще можно найти факторы связанные с Украиной:
- Фактор равен единице, если у сайта стоит украинский гео-атрибут
- Украинский Page rank
- Показывает, что запрос на украинском языке
Пост опубликован в учебных целях.