puslapio reitingo skaičiavimas. Paaiškino PageRank. Kas yra PageRank ir kodėl jis reikalingas

Koks yra geriausias būdas valdyti vidinių nuorodų indeksavimą svetainėje, siekiant padidinti atskirų jos puslapių PR? Apsvarstykite formulę, apskaičiuojančią dabartinio puslapio A PR:

Čia d- etaloninio svorio silpnėjimo koeficientas, jo tikslią reikšmę Google paslepia, dažniausiai imamas 0,85. Mūsų klausimo kontekste tai nėra reikšminga, nes norime įvertinti pasirinktų svetainės puslapių PR, palyginti su visais kitais;
T 1 ,…, T n – puslapiai, nukreipiantys į A;
PR (T 1 ) ,…, PR (T n ) – Referencinių puslapių PR;
C (T 1 ) ,…, C (T n ) - nuorodų puslapiuose, kuriuose yra nuoroda, skaičius.

Ypatumai:

  1. Jei puslapyje yra nuoroda į save patį, į šią nuorodą skaičiuojant neatsižvelgiama.
  2. Taip pat neatsižvelgiama į nuorodas į puslapius, kuriuose nėra nuorodų.
  3. Dvi ar daugiau identiškų nuorodų iš to paties puslapio laikomos viena.
  4. „Google“ kai kuriose svetainėse gali įvesti filtrus, kurie pablogina nuorodų svorio srautą ir iškraipo PR nustatymo formulę, į šį poveikį čia neatsižvelgiame.

Kaip naudoti šią formulę, nes dešinėje pusėje rodomas taip pat skaičiuojamų puslapių PR? Paimkime visus „Google“ indeksuotus interneto puslapius ir paimkime kiekvieno iš jų pradinį PR kaip vieną, tada paeiliui apskaičiuokime visų puslapių reitingą. Tai buvo pirmoji iteracija, kai kiekvienas puslapis gavo tam tikrą PR vertę. Skaičiavimus pagal šį algoritmą kartojame daug kartų, naudodami ankstesniame žingsnyje gautas vertes kaip PR puslapius. Algoritmo ypatumas yra tas, kad nesvarbu, kokį pradinį PR imtume ir kokia tvarka jį skaičiuotume, esant pakankamai dideliam iteracijų skaičiui, pasieksime tuos pačius skaičius.

Tačiau įprastas sveikųjų skaičių PR nuo 0 iki 10 nėra toks, kokį gavome ankstesnėje pastraipoje. PR 0…10 – vadinamasis „įrankių juostos“ PR ( Įrankių juosta PageRank), jis buvo įvestas, kad būtų galima pateikti visas PR reikšmes absoliučiais dydžiais, neatsižvelgiant į puslapių skaičių tinkle. Štai jis:

kur bazė yra skaičius, priklausantis nuo puslapių skaičiaus „Google“ indekse ir kitų veiksnių, paprastai paimamų bazė lygus 7;
a– redukcijos koeficientas, 0< a≤ 1, dažniausiai laikomas 1.

Šansai bazė Ir a, kaip ir pati TLPR formulė, mums dabar nėra svarbios, svarbiausia, kad TLPR padidėjimas visada yra susijęs su PR padidėjimu, todėl mes sutelksime dėmesį į pastarąjį. Pamirškime išorines nuorodas į kitus išteklius ir pabandykime skaičiuoti PR pagal tik vidinius veiksnius. Tarkime, kad turime šešių puslapių svetainę:

Kiekvienas turi meniu: „Pagrindinis puslapis“, „Apie svetainę“, „Straipsnių sąrašas“. Meniu elementai pateikiami visuose svetainės puslapiuose. „Straipsnių sąrašas“ taip pat reiškia puslapius su straipsniais. Puslapio reitingas su tokiu nuorodų pasiskirstymu nurodytas aukščiau esančioje diagramoje. Skaičiuodamas PR padariau 100 pakartojimų, pradinę reikšmę paėmęs vieną ir gautus skaičius suapvalinau iki šimtųjų po kablelio.

Tarkime, kad norime reklamuoti tik pagrindinį puslapį. Norint padidinti PR, būtų logiška leisti indeksuoti tik tas nuorodas, kurios veda į jį. Tuo pačiu atsižvelgiame į tai, kad nuo svetainės neturėtų būti atkirstas nė vienas puslapis, tai yra, kiekviename puslapyje turi būti pateikta indeksuota nuoroda:

Na, prašomo puslapio PR pakilo. Dabar pabandykime įdėti nuorodą į „1 straipsnį“ ir pažiūrėkime, kaip pasikeičia paskirstymas:

Atrodytų, kad pagrindiniame puslapyje įdėję papildomą nuorodą, turėtume iš jos atimti nuorodos svorį ir taip ją susilpninti. Tačiau iš tikrųjų pasirodo visiškai priešingai – etaloninis svoris grįžta didėjant! Šiuo veiksmu kartu iškeliame „1 straipsnį“.

Dabar apsigalvokime ir nuspręsime reklamuoti tik straipsnių sąrašą:

Mums ką tik pavyko gauti aukščiausią PR iš visų anksčiau apskaičiuotų, lygų 2,8 straipsnių sąrašui. Kaip rodo šis pavyzdys, lengviau padidinti puslapio, kuriame yra daug vidinių nuorodų, PR, žinoma, jei jame yra įdiegtos atgalinės nuorodos. Tas pats efektas buvo parodytas, kai mes padarėme nuorodą į „1 straipsnį“ iš pagrindinio.

O dabar sulaužysime loginę svetainės struktūrą: įdėsime nuorodas iš pagrindinio puslapio į visus kitus, o iš visų puslapių – į pagrindinį. Kitos nuorodos bus uždarytos nuo indeksavimo.

  1. Geriausias būdas padidinti puslapių su daugybe nuorodų reitingą yra įdiegti atgalines nuorodas. Tokiuose puslapiuose yra forumai, straipsnių sąrašai, svetainių schemos ir kt.
  2. Puslapio PR pakyla puikiai, jei įdėsite nuorodą į jį iš puslapių iš 1 p., kaupdami Page Rank.
  3. Norint padidinti pagrindinio puslapio PR, bus naudinga patalpinti pranešimus apie straipsnius, naujienas ir pan., vedančius į puslapius su visu tekstu. Vėlgi, nepamirškite apie atgalines nuorodas.

Ir čia yra scenarijus, kuris padės jums apskaičiuoti PR. Eksperimentuokite su įvairiomis nuorodų indeksavimo svetainėje parinktimis.

    // svetainės puslapių masyvas: pirmasis kiekvieno puslapio masyvo elementas yra jo pavadinimas,

    // visi kiti elementai yra masyvo puslapių, susietų iš dabartinio, indeksai

    $puslapiai = masyvas

    array( "Pagrindinis puslapis", 1 , 2 ) ,

    masyvas ("Apie svetainę" , 0 , 2 ) ,

    masyvas ("Straipsnių sąrašas" , 0 , 1 , 3 , 4 , 5 ) ,

    array("1 elementas" , 0 , 1 , 2 ) ,

    array("2 elementas" , 0 , 1 , 2 ) ,

    array("3 elementas" , 0 , 1 , 2 )

    // nustatyti puslapių pradinę reikšmę PR = 1

    už ($i = 0 ; $i< count ($pages ) ; $i ++ ) $pr [ $i ] = 1 ;

    // iteracijų skaičius = 100

    už ($i = 0 ; $i< 100 ; $i ++ )

    už ($j = 0 ; $j< count ($pages ) ; $j ++ )

    $pridėti = 0 ; // augimas iš išorinių nuorodų

    už ($k = 0 ; $k< count ($pages ) ; $k ++ )

    if ($k == $j ) tęsti ;

PageRank arba puslapio reitingas yra vienas iš nuorodų reitingavimo algoritmų .

Šis rodiklis gali būti nuo 0 iki 10. Remiantis PageRank reitingavimo algoritmu, atsirado Google.

Jei „PageRank“ pateikiamas tikslus apibrėžimas, tada:

PageRank yra skaitinė reikšmė, apibūdinanti tinklalapio „svarbą“. Kuo daugiau nuorodų į puslapį, tuo jis tampa „svarbesnis“. Be to, puslapio A „svoris“ nustatomas pagal puslapio B perduodamos nuorodos svorį. Taigi, PageRank yra puslapio svorio apskaičiavimo metodas, skaičiuojant nuorodų į jį svarbą.

PageRank apskaičiuojamas kiekvienam puslapiui ir, jei sukuriate kompetentingą svetainės struktūrą, jis gali būti paskirstytas tolygiai arba atlikti reikiamas užduotis svetainėje.

Kaip patikrinti PageRank

Puslapio reitingą galima patikrinti naudojant įvairias paslaugas ar įrankių juostas naršyklėse. Pavyzdžiui, svetainė google.com turi PageRank 9 iš 10.

PR tikrinimo paslaugos:

cy-pr.com
pr-cy.ru

Taigi tai galima padaryti naudojant įrankių juostas, pavyzdžiui:

seoquake.com
development.ru/seobar
www.recipdonor.com/bar

Kaip minėta toliau, PageRank turi įtakos svetainės reitingui, ir jei daug nuorodų su aukštu puslapio reitingu nukreipia į reklamuojamą svetainę, jūsų svetainės PR padidės.

Pagrindinė formulė, apibūdinanti PR:

Gana platų straipsnį parašė Aleksandras Sadovskis, apie paaiškintą PageRank, straipsnį skaitome čia

„Google PageRank“ knygos

– Google PageRank and Beyond: The Science of Search Engine Rankings

Šioje knygoje gausu formulių, o norint ją sėkmingai perskaityti reikia bent jau gerai išmanyti matematiką.

Dažnai užduodami klausimai kaip šis

Kaip padidinti svetainės PR?

Tiesą sakant, yra daug būdų, kaip tai padaryti, lengviausias ir labiausiai paplitęs yra įdėti nuorodas iš aukšto PR svetainių, o kai paieškos variklis atsižvelgs į nuorodas ir atnaujins algoritmą, jis jūsų svetainėje padidės.

Kada ir kaip dažnai atnaujinamas PageRank?

Anksčiau PR buvo atnaujinamas kas 3-4 mėnesius, dabar atnaujinamas įvairiais būdais, ir nėra aiškių intervalų, tai gali būti 1-3 kartus per metus.

Tai įrankių juostos (ką mes matome) puslapio reitingo atnaujinimas, vidinis PR greičiausiai atnaujinamas dažniau.

Ar svetainės srautas turi įtakos PageRank?

Ne, taip nėra. PageRank turi įtakos nuorodų, nukreipiančių į svetainę, skaičius ir kokybė.

PageRank yra vienas iš Google paieškos sistemos reitingavimo algoritmų. Kuo jis didesnis jūsų svetainėje, tuo geriau.

Norėdami apskaičiuoti puslapio PageRank, turite atsižvelgti į visas vidines ir išorines nuorodas į tą puslapį. Žemiau pateikiama lygtis, kaip apskaičiuoti puslapio A PageRank reikšmę.

PR(A)=(1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))

PR(t1…tn)- puslapio, nukreipiančio į A puslapį, svoris

C- išeinančių nuorodų iš A puslapio skaičius

d yra susilpnėjimo koeficientas, paprastai laikomas 0,85.

Puslapis „balsuoja“ savo PageRank reikšmę kiekviename puslapyje, į kurį jis nukreipiamas. Puslapio balsavimo reikšmė yra paties puslapio PageRank vertės * 0,85 suma. Ši vertė paskirstoma tolygiai visiems puslapiams, į kuriuos nukreipia išeinančios nuorodos.

Lygtis reiškia, kad viena nuoroda iš PR4 puslapio su penkiomis išeinančiomis nuorodomis turės didesnį svorį nei nuoroda iš PR8 puslapio su 100 siunčiamų nuorodų. Kuo daugiau siunčiamų nuorodų puslapyje, tuo mažiau PageRank bus perduota tai nuorodai.

Atminkite, kad kai puslapis balsuoja už savo PageRank kituose puslapiuose, to puslapio PageRank nesumažėja. Balsavimo puslapis neprideda jo PageRank vertės. Tai tarsi akcininkų susirinkimas, kuriame kiekvienas akcininkas balsuoja pagal jam priklausančių akcijų skaičių, bet jų neatiduoda. Be to, pamatysime, kad visi tie patys puslapiai netiesiogiai praranda tam tikrą PageRank.

Lygtis aiškiai parodo, iš kur gaunama bet kurio puslapio PageRank reikšmė. Tarkime, kad turime 2 puslapius, A ir B, kurie nukreipia vienas į kitą, kitų nuorodų šiuose puslapiuose nėra. Štai kas nutinka:

„Google PageRank“ apskaičiavimas puslapiui A

1 žingsnis: Apskaičiuokite puslapio A reikšmę PageRank

Puslapis dabar turi naują PageRank reikšmę. Skaičiuojant buvo naudojamas išeinančios nuorodos iš B puslapio svoris. Tačiau B puslapis taip pat turi siunčiamą nuorodą į puslapį A, o gauta PageRank reikšmė negali būti tiksli, kol nežinoma B puslapio PageRank reikšmė.

„Google PageRank“ apskaičiavimas puslapiui B

2 žingsnis: apskaičiuokite B puslapio PageRank reikšmę

Puslapyje B dabar yra nauja PageRank reikšmė, kuri negali būti tiksli, nes puslapio A reikšmė yra netiksli skaičiavimui.

Negalime apskaičiuoti tikslaus A puslapio reitingo, kol nežinome B puslapio reitingo, ir negalime apskaičiuoti tikslaus B puslapio reitingo, kol nežinome A puslapio reitingo.

Puslapių A ir B PageRank reikšmę galima perskaičiuoti vėl ir vėl, ir kiekvieną kartą rezultatas skirsis nuo ankstesnio ir bus netikslus. Skaičiavimus galime pakartoti dar kartą naudodami ankstesniame žingsnyje gautas vertes. Tačiau skaičiavimams visada naudojame netikslias vertes, todėl rezultatai visada bus netikslūs.

Galite išspręsti problemą daug kartų kartodami skaičiavimus. Kiekvieną kartą gausime šiek tiek tikslesnius rezultatus. Tiesą sakant, tikslumo niekada nepavyks pasiekti, nes skaičiavimai visada grindžiami netiksliais įvestimis.

Anksčiau ar vėliau pasieksime tašką, kai tolimesnė iteracija turės mažai įtakos skaičiavimų rezultatams. Tai paaiškina, kodėl visų „Google“ puslapių PageRank verčių perskaičiavimas užima tiek daug laiko ir skaičiavimo išteklių.

Vienintelis dalykas, dėl kurio galime būti tikri, yra tai, kad nuoroda iš bet kurio šaltinio padidina mūsų svetainės PageRank.

Skaičiuojama nuo nuorodų į šį puslapį – tiek išorinių, tiek vidinių – skaičiaus ir kokybės.

PageRank skaičiavimas

Puslapio PageRank galima pakankamai tiksliai apskaičiuoti naudojant formulę, apibendrintą iš algoritmų ir formulių, pateiktų pagrindiniame Google įkūrėjų Sergejaus Brino ir Larry Page'o straipsnyje:

PR(A) = (1 – d) + (PR(T1)/C(T1) + + PR(Tn)/C(Tn))d (Pavadinkime tai „Formule Nr. 1“)

Norint pateikti būtinus formulėje pateiktų simbolių paaiškinimus, reikėtų pripažinti, kad daugelis reikšmių ir pavadinimų, kuriuos Google naudoja skaičiuodama PR, yra jos komercinė, patentuota paslaptis. Todėl hipotetiniai paaiškinimai, kuriuos optimizavimo bendruomenė gavo eksperimentiniu būdu, bus pateikti žemiau.

  • d- vadinamasis slopinimo koeficientas, atspindintis donoro puslapio (nuorodos šaltinio) perduodamą „įgaliojimo dydį“ akceptoriaus puslapiui (kuriam skaičiuojamas PR). Koeficiento reikšmę klasifikuoja paieškos sistema, tačiau stebėjimai rodo, kad su tam tikru tikslumu jis gali būti lygus 0,85 (tai yra 85% perduoto autoriteto). Remiantis kitais šaltiniais, slopinimo koeficientas parodo perėjimo iš donoro puslapio į akceptorių tikimybę per nustatytą nuorodą. Nepaisant apibrėžimų skirtumo, d šiuo atveju taip pat laikomas lygiu 0,85.
  • n- puslapių, kuriuose nustatytos nuorodos į tą, kuriam skaičiuojamas PR, skaičius.
  • SU- bendras donoro puslapyje įdiegtų išorinių nuorodų skaičius.
  • T(nuo 1 iki n) - nukreipiančių puslapių skaičius.

Įrankių juosta PageRank

Dėl didžiulio internete paskelbtų puslapių skaičiaus PR skaitinės reikšmės, išreikštos absoliučiais dydžiais, nėra patogi priemonė greitai įvertinti svarbą (toks įvertinimas būtinas, pavyzdžiui, sprendžiant, ar įdiegti hipersaitą konkrečioje svetainėje). Šiuo atveju daug patogiau naudoti siūlomą „Google“ įrankių juostos puslapio reitingas. Tai yra specialus naršyklėms skirtas priedas, rodantis svetainės svarbą kaip skaičių nuo 1 iki 10. TLPR apskaičiuojamas pagal formulę:

TLPR = log bazė (PR) a

Tiksli logaritmo pagrindo reikšmė bazė, kuris priklauso nuo puslapių skaičiaus internete, neegzistuoja, o jo skaičiavimo formulė taip pat yra paieškos sistemos paslaptis. Tačiau stebėjimų dėka jį galima laikyti artimu skaičiui 7. Panašiai ir koeficiento reikšmė a iš intervalo (0;1] jie ima 1. Taigi pakankamai dideliu tikslumu puslapio, kuris bus rodomas vartotojų naršyklėse, „įrankių juostos“ svarbą galima apskaičiuoti taip:

TLPRlog 7 (PR)

Svarbu pažymėti, kad pats Google paieškos algoritmas reitinguodamas puslapius naudoja tikrąjį PageRank. TLPR skirtas tik optimizatorių patogumui.

PageRank padidinimas naudojant vidinį susiejimą

PageRank skaičiavimo formulė

Remiantis reitingavimo formule (formulė 1), galima teigti, kad bet kurio puslapio minimalus PR negali būti nulis arba neigiamas. Jei tai priimsime d=0,85, Tai 1 – d = 0,15. Taigi išvada: PR min = 0,15(suma garbanotuose skliaustuose formulė 1 = 0).

Taigi, net visiškai naujai svetainei su dideliu puslapių skaičiumi ir be išorinių nuorodų, ačiū kompetentingai

„PageRank“ yra vienas iš pagrindinių svetainės išorinių rodiklių, kuris daro didelę įtaką jūsų šaltinio populiarumui internete ir daro didelę įtaką potencialioms pajamoms, kurias galite gauti (pavyzdžiui, parduodant nuorodas savo svetainės puslapiuose).
Šiame straipsnyje noriu išsamiai aprašyti visus dalykus, susijusius su „Google PageRank“.

Kas yra PageRank ir kam jis skirtas?
Kaip žinote, „PageRank“ yra skaitinis santykinės svetainės puslapio autoriteto tarp visų kitų interneto puslapių rodiklis, kurį naudoja „Google“ paieškos sistema. PageRank yra pagrįstas principu, kad mokslininko patikimumas moksliniuose sluoksniuose apskaičiuojamas pagal tai, kas ir kaip dažnai iš kitų mokslininkų remiasi šio mokslininko darbu.
PageRank funkcijos:
- indikatorius priskiriamas ne visam ištekliui, o atskiram svetainės puslapiui (paprastai pagrindinis puslapis turi aukščiausią PageRank lygį, nes į jį yra daugiausia nuorodų);
- nuoroda, vedanti iš puslapio, nesumažina šio puslapio PageRank (statinio svorio);
- PageRank lygis neturi įtakos puslapio aktualumui, tai yra, jis nepateks į pirmąsias pozicijas paieškos užklausose vien dėl to, kad turi didesnį svorį. Tam tikru mastu tai tikrai turi įtakos pozicijai, tačiau „Google“ teikia pirmenybę kokybiškam puslapio turiniui, atitinkančiam paieškos užklausą.

Kam skirtas PageRank? Juk tai neturi įtakos aktualumui.
Žiniatinklio valdytojams to reikia, kad padidėtų nuorodų į savo išteklius kaina. Jei nuorodos puslapyje (ne pagrindiniame) su PR = 0 kainuoja daugiausiai 10 centų, tai su PR = 4 kainuoja daug kartų daugiau.
Taip pat aukštas PageRank lygis rodo puslapio autoritetą, visapusišką jo suvokimą Google paieškos sistemoje. Tokių puslapių derinys leidžia „Google“ susidaryti teminę nuomonę apie šaltinį. Nesakysiu, bet manau, kad gana dažnai Google neranda konkrečios prašomos informacijos ir pateikia atsakymus į panašius teminius išteklius ir atitinkamai reitinguoja pagal PageRank lygį. Tarsi sufleruotų vartotoją, kur jis galėtų rasti jį dominančią informaciją.

Kaip apskaičiuoti PageRank?
Norėdami apskaičiuoti puslapio PageRank, turite atsižvelgti į visas vidines ir išorines nuorodas į šį puslapį:
- kuo daugiau išorinių nuorodų į puslapį, tuo daugiau PageRank svorio perkeliama į šį puslapį;
– kuo daugiau vidinių nuorodų puslapyje (įskaitant išorines nuorodas į kitus išteklius), tuo didesnis PageRank svoris tolygiai paskirstomas kiekvienai nuorodai. Taigi visos nuorodos gaus vienodą svorį.

Remdamiesi tuo, turite sukurti vidinį svetainės susiejimą, kad PageRank būtų perkeltas į visus puslapius, bet ne iš karto, o grandine. Ir kuo ilgesnė grandinė, tuo didesnį svorį įgauna joje esantys puslapiai (galite išjungti PageRank perkėlimą į nuorodas, pridėdami prie jų atributą rel=nofollow).

Puslapio puslapio reitingui apskaičiuoti galima naudoti šią lygtį:

PR(A) = (1-d) + d(PR(t1)/C(t1) +... + PR(tn)/C(tn))

PR() – puslapio PageRank kaip skaitinis skaičius (slankiojo kablelio skaičius);
A – puslapio PageRank, kurį nustatome;
t1...tn - puslapis, nukreipiantis į A puslapį;
C - išeinančių nuorodų iš puslapio A skaičius;
d yra slopinimo koeficientas, paprastai laikomas 0,85.

Puslapis perduoda PageRank reikšmę visiems puslapiams, į kuriuos jis nukreipia. Šiuo atveju PageRank reikšmė apskaičiuojama kaip paties puslapio PageRank reikšmė, padauginta iš 0,85. Tada ši vertė paskirstoma tolygiai visiems puslapiams, su kuriais ji susijusi.

Lentelės pagalba galime apytiksliai apskaičiuoti, kokį PageRank gaus mūsų puslapis su tam tikru skaičiumi nuorodų į jį:

Nuorodų skaičius: Puslapių reitingas, kuriame pateikiamos nuorodos į mūsų puslapius:
0 1 2 3 4 5 6 7 8 9 10
1 0 0 0 +1 +2 +3 +4 +5 +6 +7 +8
4 0 0 +1 +2 +3 +4 +5 +6 +7 +8 +9
19 0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10
101 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 -
555 +2 +3 +4 +5 +6 +7 +8 +9 +10 - -
3 055 +3 +4 +5 +6 +7 +8 +9 +10 - - -
16 803 +4 +5 +6 +7 +8 +9 +10 - - - -
92 414 +5 +6 +7 +8 +9 +10 - - - - -
508 277 +6 +7 +8 +9 +10 - - - - - -
2 795 522 +6 +7 +8 +9 +10 - - - - - -
15 375 379 +7 +8 +9 +10 - - - - - - -
84 564 584 +8 +9 +10 - - - - - - - -
449 527 525 +9 +10 - - - - - - - - -

Galite patikrinti PR puslapių vertę