53 фактора ссылочного ранжирования Яндекс - Студия MetaDiv (МетаДив)
  • Пн. - Вс. с 9:00 до 19:00
  • +7 915 457 11 34
  • info@metadiv.ru
  • г. Москва

53 фактора ссылочного ранжирования Яндекс

• «Относительная частота слов запроса в ссылках (1 — слова запроса часто встречаются в ссылках, 0.3 — редко); если точнее, значение этого фактора пессимизируется при условии: TR=0 && LR=0 && (нет ни одной ссылки со всеми словами запроса) && (не прошёл кворум) && (в тексте встречается хотя бы одна пара слов запроса)»
• «В ссылках есть все слова запроса»
• «В одной ссылке есть все слова запроса»
• «Есть ссылка, прошедшая кворум»
• «Какая доля ссылок “хорошая”»
• «Насколько много “плохих” ссылок (плохой = dpr = 0)»
• «Максимальный dpr ссылки»
• «TfIdf обычный TF*IDF по ссылкам. Частота слова в ссылках умножается на обратную документную частоту и суммируется по всем словам, потом нормируется на длину документа.»
• «Есть точная форма всех слов запроса в тексте/линках»
• «Есть лемма всех слов запроса в тексте/линках»
• «Число ссылок, точно совпадающих с запросом»
• «Число обратное дисперсии временам появления ссылок со словами запроса»
• «Линковая релевантность с учетом тематичности»
• «Линковая релевантность с учетом качества каждой ссылки»
• «Линковая релевантность с учетом качества каждой ссылки и тематичности каждой ссылки»
• «Линковая релевантность с учетом некоммерческости каждой ссылки»
• «Линковая релевантность с учетом некоммерческости каждой ссылки, качества каждой ссылки и тематичности»
• «Процент входящих ссылок со словами запроса»
• «Процент слов запроса в ссылках (с точностью до синонима)»
• «В ссылках есть все слова запроса (с точностью до синонима)»
• «LR по парам слов запроса в обратном порядке»
• «LR по парам слов запроса через одно слово в текстах»
• «Средний возраст ссылок, внесших что-то в LR LinkAge=Min(log(средний возраст ссылки)/7, 1), за 1 принято 3 года»
• «LR с учетом совпадения языка ссылки и запроса и накрученности»
• «LR по отписанию в Яндекс.Каталоге»
• «Максимальный возраст значимого скопления ссылок, внесших что-то в LR»»Хост ранк по максимально выраженному слову запроса (обычно это название сайта)»
• «Доля входящих продажных ссылок. Реализован алгоритм распознавания коммерческих ссылок. Фактор ремапится на [0,1] если доля таких ссылок > 50%, иначе 0.»
• «Фактор CommLinksSEOHosts умноженный на NonCommercialQuery»
• «Характеризует частоту слов в ссылках. Фактор большой, если слово, сыгравшее в линковой релевантности, редкое для ссылок.»
• «Вес слов запроса, которые есть в линках»
• «Простой BM25 по точной форме в текстах ссылок»
• «LR по ссылкам из Яндекс.Маркета»
• «Дополнительные факторы про раскрученность сайта линковыми кольцами”
• «Линковая релевантность с пессимизацией за большой возраст линка»
• «Хостовые факторы, определяют сайты, накрученные линками — вторая и третья входящие степени”
• «Считали LinkQuality для этой страницы или нет (не считали, если ссылок мало)»
• «Количество различных внутренних ссылок на страницу»
• «Периодичность ссылок на сайт»
• «Количество почти-периодических ссылок»
• «Считает сумму вхождений следующего вида: последовательность слов запроса длиной больше двух, встретившихся в одной ссылке; нормировано на кол-во ссылок.»
• «Число входящих ссылок с морд»
• «Бинарный фактор, каждое слово запроса есть в тексте или в линках»
• «Отношение числа входящих ссылок, текст которых является URL, к числу всех входящих ссылок»
• «Количество входящих сео-треш ссылок между хостами»
• «Доля уникальных триграмм заголовка в триграммах ссылок»
• «Сумма максимальных значений SourceRank’ов для каждой входящей ссылки с учётом уникальности владельца.»
• «BM25 по текстам и линкам со спец. весами по уровню совпадения (форма, лемма, синоним)»
• «Вес слов запроса, которые есть в тексте в точной форме»
• «Позволяет оценить является ли документ ‘живым’ с точки зрения ссылок на него приходящих.»
• «Дисперсия количества слов запроса в ссылках.»
• «BM с затуханием по тексту каталожных ссылок.»
• «На данный урл есть ссылка из Infobox-ов в Википедии.»
• «Ранк качества текстов на хосте. Чем выше — тем больше вероятность того, что хост полон статей — рерайта, плохого копирайта, заказанного на биржах контента.