PageRank

Материал из Википедии — свободной энциклопедии
Перейти к навигацииПерейти к поиску
Математический рейтинг веб-страницы (PageRank) для простой сети, выраженный в процентах (Google используетлогарифмическую шкалу). Вебстраница C имеет более высокий рейтинг, чем страница E, хотя есть меньше ссылок на C, чем на Е, но одна из ссылок на C исходит из более важных страниц и, следовательно, имеет более высокое значение. Если условно считать, что веб-пользователь, который находится на случайной странице, имеет 85%-ю вероятность выбора случайной ссылки на текущей странице, и 15%-ю — перехода на любую другую страницу, то вероятность перехода к странице E с других ссылок равна 8,1 % времени (15 % вероятности перехода к произвольной странице соответствует коэффициенту затухания 85 %). Без затухания все веб-пользователи в конечном итоге попадают на страницы A, B или С, и все остальные страницы будут иметь PageRank, равный нулю. При наличии затухания страница А эффективно связывает почти все ссылки на страницы в этой Сети, даже если она не имеет своих собственных исходящих ссылок.

PageRank («пэйдж-ранк»; от англ .pagerank — ранжирование веб-страниц или рангЛ. Пейджа) — один изалгоритмовссылочногоранжирования. Алгоритм применяется к коллекции документов, связанныхгиперссылками (таких, каквеб-страницы извсемирной паутины), и назначает каждому из них некоторое численное значение, измеряющее его «важность» или «авторитетность» среди остальных документов. Вообще говоря, алгоритм может применяться не только к веб-страницам, но и к любому набору объектов, связанных между собой взаимными ссылками, то есть к любомуграфу.

Содержание

Описание

[править |править код]

PageRank — это числовая величина, характеризующая «важность» веб-страницы. Чем большессылок на страницу, тем она «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы путём подсчёта важности ссылок на неё.

История

[править |править код]

В 1996 годуСергей Брин иЛарри Пейдж, тогда ещё аспирантыСтэнфордского университета, начали работу над исследовательским проектом BackRub[1] — поисковой системой по Интернету, использующей новую тогда идею о том, чтовеб-страница должна считаться тем «важнее», чем больше на неё ссылается других страниц, и чем более «важными», в свою очередь, являются эти страницы.[2] Через некоторое время BackRub была переименована вGoogle. Первая статья с описанием применяющегося в ней алгоритма ранжирования, названного PageRank, появилась в начале 1998 года[3], за ней следом вышла и статья с описанием архитектуры самой поисковой системы.[4]

Их система значительно превосходила все существовавшие тогда поисковые системы, и Брин с Пейджем, осознав её потенциал, основали в сентябре 1998 года компаниюGoogle Inc. для дальнейшего её развития как коммерческого продукта.

С тех пор алгоритмы и математические модели, применяемые при ранжировании в Google, значительно улучшились. В интервью в 2007 годуАмит Сингхал, представитель отдела качества поиска Google, заявлял, что их поисковая система использует более 200ранжирующих сигналов, лишь одним из которых является PageRank,[5] но он все еще играл существенную роль в поисковых продуктах Google.[6] Алгоритм PageRank, в том виде, в каком он был изложен Пейджем в статье 1998 года[3], может быть улучшен в некоторых практических аспектах (например, ссылкам могут назначаться разные веса), и алгоритмы, применяемые в современных поисковых системах, являются скорее лишь его вариантами.

PageRank можно перевести с английского языка как «ранг страницы», однакоGoogle Inc. связывает слово Page в названии алгоритма не с английским словом «страница», а с именемЛарри Пейджа (англ. Larry Page)[7].

Название «PageRank» является торговой маркой компанииGoogle Inc. Алгоритм запатентован в США 4 сентября 2001 года[8], в качестве изобретателя алгоритма в патенте указан Ларри Пейдж. Официальным владельцем патента является не Google Inc., аСтэнфордский университет, в котором учились Ларри Пейдж и Сергей Брин в момент подачи заявки на патент.

В 1998 году Google был одной из первых поисковых систем, внедривших ссылочное ранжирование, благодаря чему добился значительного улучшения качества поиска по сравнению с конкурентами. В дальнейшем многие крупные поисковые системы разработали и внедрили свои аналоги PageRank и другие методы статического (то есть запросо-независимого) ранжирования документов[9].

Последнее обновление Google PageRank произошло 6 декабря[10].

16 апреля 2016 года компания Google официально убирает этот показатель и обнуляет PageRank у всех сайтов.

10 января 2018 года истёк срок действия патента на изобретениеU.S. Patent 6 285 999, однако PageRank всё ещё охраняется как товарная марка.

Скульптурирование PageRank

[править |править код]

Скульптурирование PageRank (англ. PageRank sculpting) — манипулирование количеством PageRank, передаваемого через конкретные ссылки страницей N другим страницам с помощью присвоения одной или нескольким ссылкам, идущим с этой страницы, атрибутаnofollow, что приводит к удержанию большего PageRank («веса») на странице N с целью дальнейшей его передачи нужным страницам.

В 2009 годуМэтт Каттс заявил, что скульптурирование PageRank больше не работает, так как теперь постановка любых ссылок (как с атрибутом nofollow, так и без него) приводит к равномерному распределению передаваемого PageRank («веса») между исходящими ссылками[11].

PageRank в продуктахGoogle

[править |править код]

Надстройка для браузераGoogle Toolbar показывает для каждой веб-страницы целое число от 0 до 10, которое она называет PageRank, или важностью этой страницы с точки зрения Google. Однако механизм его расчёта и что в точности обозначает это значение, не раскрывается. По некоторым данным, эти значения обновляются лишь несколько раз в год (в то время, как внутренние значения PageRank пересчитываются непрерывно[12]) и показывают значения PageRank страниц на логарифмической шкале.[13] Каждый месяц Google обновляет алгоритмы, которые существенно повлияли на формирование выдачи. На основе этой информации вы сможете проанализировать состояние своего сайта и выявить проблемы, из-за которых возникают трудности в продвижении[14].

С 2016 года Google официально отключил «тулбарный» показатель PageRank, после чего узнать значение PR из браузеров и других инструментов стало невозможно[15], однако можно узнать истории значения PR различных сайтов до этой даты.

См. также

[править |править код]

Примечания

[править |править код]
  1. Corporate Information — Google Milestones . Дата обращения: 4 января 2010. Архивировано 20 мая 2011 года.
  2. Wired: The Birth of GoogleАрхивная копия от 18 марта 2014 наWayback Machine (англ.)
  3. 12Lawrence Page, Sergey Brin, Rajeev Motwani and Terry Winograd. The PageRank Citation Ranking: Bringing Order to the Web (англ.). — 1998. Архивировано 17 октября 2011 года.
  4. Sergey Brin, Lawrence Page. The Anatomy of a Large-Scale Hypertextual Web Search Engine (англ.). — 1998. Архивировано 25 апреля 2009 года.
  5. New York Times: Google Keeps Tweaking Its Search EngineАрхивная копия от 5 июня 2015 наWayback Machine (англ.)
  6. Corporate Information — Technology Overview . Дата обращения: 4 января 2010. Архивировано 23 июня 2008 года.
  7. Facts about Google and Competition (англ.). www.google.com. Архивировано 9 февраля 2012 года.
  8. U.S. Patent 6 285 999
  9. Matthew Richardson, Amit Prakash, Eric Brill. Beyond PageRank: Machine Learning for Static Ranking (англ.). — 2006. Архивировано 13 января 2010 года.
  10. PageRank Updates History . Дата обращения: 4 февраля 2016. Архивировано 28 января 2016 года.
  11. Pagerank sculptingАрхивная копия от 11 мая 2011 наWayback Machine — Matt Cutts blog
  12. Matt Cutts: More info on PageRank . Дата обращения: 5 января 2010. Архивировано 8 февраля 2010 года.
  13. Google Answers: My Page Rank . Дата обращения: 5 января 2010. Архивировано 7 ноября 2009 года.
  14. Алгоритмы Google: обзор апдейтов за последние 7 лет【EMBO Studio】 . Архивировано 20 июля 2021 года.
  15. Google Confirms Toolbar PageRank is No More | SEJ.Search Engine Journal (англ.). 9 марта 2016.Архивировано 12 февраля 2019. Дата обращения: 2 ноября 2018.

Ссылки

[править |править код]
В другом языковом разделеесть более полная статьяPageRank  (англ.).
Вы можете помочь проекту, расширив текущую статьюс помощью перевода
Перейти к шаблону «External links»
Ссылки на внешние ресурсы
Перейти к шаблону «Внешние ссылки» Перейти к элементу Викиданных
  Словари и энциклопедии
Перейти к шаблону «Google»
  • Председатель совета директоров:Эрик Шмидт
  • Директор, президент по технологиям и сооснователь:Сергей Брин
  • Главный исполнительный директор и сооснователь:Ларри Пейдж
    Материнская компания:Alphabet
Реклама
Коммуникации
ПО
Платформы
Инструменты
разработки
Публикация
Поиск (PageRank)
Тематические проекты
Закрытые проекты
См. также
Источник —https://ru.wikipedia.org/w/index.php?title=PageRank&oldid=151194586
Категории:
Скрытые категории: