Nopludināta iekšējā Google dokumentācija

Īss ieskats:

Tūkstošiem iekšējo Google dokumentu, kas atklāj meklētājprogrammu rezultātu algoritma darbību, ir kļuvuši publiski pieejami. Šajos dokumentos ir vairāk nekā 2500 lapu API dokumentācijas, kurā aprakstīti 14 014 atribūti — API funkcijas, kas tiek izmantotas Google arhīva iekšējā satura API.

Tūkstošiem iekšējo Google dokumentu, kas atklāj meklētājprogrammu rezultātu algoritma darbību, ir kļuvuši publiski pieejami. Šajos dokumentos ir vairāk nekā 2500 lapu API dokumentācijas, kurā aprakstīti 14 014 atribūti — API funkcijas, kas tiek izmantotas Google arhīva iekšējā satura API.

Lūk, kā viņi izskatās:

Nopludināti iekšējie Google dokumenti Google API atribūti

Kas notika?

2024. gada 13. martā robots yoshi-code-bot vietnē Github ievietoja tūkstošiem dokumentu, iespējams, no Google iekšējās satura API noliktavas. Šie dokumenti iepriekš tika kopīgoti ar SparkToro līdzdibinātāju Rendu Fiškinu, slavenu SEO un mārketinga ekspertu.

Pamatojoties uz saistību vēsturi, kods tika augšupielādēts GitHub 2024. gada 27. martā un noņemts tikai 2024. gada 7. maijā. Šajā laikā konfidenciālas atziņas izdevās izplatīties visā SEO kopienā.

Vai šos dokumentus var uzskatīt par autentiskiem?

Pēc ekspertu domām, ir pamats uzskatīt, ka nopludinātie dokumenti ir īsti:

    • Pirmkārt, daudzas no dokumentos esošajām detaļām atbilst liecībām no Google nesenās pretmonopola izmeklēšanas. Tas norāda, ka informācija atspoguļo uzņēmuma meklēšanas algoritmu faktisko iekšējo darbību.
    • Otrkārt, dokumentos aprakstītās sistēmas un signāli atbilst vispārīgiem priekšstatiem par mūsdienu meklētājprogrammu darbības principiem, kuru pamatā ir mašīnmācīšanās. Tiek minēti šādām norisēm raksturīgi jēdzieni: satura vektora attēlojums, tekstu oriģinalitātes novērtējums, uzvedības datu vākšana u.c.
    • Treškārt, noplūdes tehniskās detalizācijas un specializētās terminoloģijas līmenis ir tik augsts, ka ir maz ticams, ka šādu materiālu varētu izgatavot kāds nepiederošs cilvēks.

Protams, tikai Google pati to var galīgi apstiprināt vai noliegt.

Kas ir iekšā?

Eksperti Rends Fiškins, SparkToro līdzdibinātājs, un Maikls Kings, iPullRank izpilddirektors, analizēja noplūdi un konstatēja:

    1. Vietnes autoritāte. Uzņēmumam Google ir vispārēja domēna autoritāte, funkcija, ko sauc par “siteAuthority”. Precīzas metodes šīs pilnvaras aprēķināšanai nav zināmas.

    1. NavBoost un klikšķu signāli. NavBoost ir modulis, kas pilnībā koncentrējas uz klikšķu signāliem. Lai pielāgotu rangu, sistēma ņem vērā uzvedības faktorus badClicks un goodClicks.

    1. Smilšu kaste. Atribūts hostAge modulī PerDocData tiek izmantots lapu kārtošanai, kas apstiprina smilškastes esamību, lai izolētu jaunus surogātpastus.

    1. Dati no Chrome. Divos moduļos tiek izmantoti dati no pārlūka Chrome. Viens novērtē skatījumus vietnes līmenī, bet otrs ņem vērā ģenerētās vietņu saites.

    1. Lapas izmaiņu vēsture. Google saglabā katras indeksētās lapas katras versijas kopiju, taču saišu analīzē tiek ņemtas vērā tikai pēdējās 20 URL izmaiņas.

Indeksēšana un ranžēšana. Tiek izmantotas sarežģītas indeksēšanas un ranžēšanas sistēmas:

  • Traleris – skenēšanas sistēma.
  • Aleksandrija ir galvenā indeksēšanas sistēma.
  • SegIndexer ir indeksu līmeņu sistēma.
  • TeraGoogle ir sekundāra indeksēšanas sistēma.
  • Mustang ir galvenā reitingu sistēma.
  • Ascorer ir galvenais ranžēšanas algoritms.
  1. Satura autorība. Google identificē ar dokumentu saistītos satura autorus un entītijas, kas ietekmē klasifikāciju.
  2. Saturs un saites. Saišu uz vietni atbilstība un daudzveidība joprojām ir svarīgi signāli. Mājas lapas PageRank ietekmē visu šīs vietnes dokumentu rangu.
  3. Pazemināti. Saturs var tikt pazemināts vairāku iemeslu dēļ:
    • Neatbilstība starp saiti un mērķa vietni — pazemināšana par neatbilstošām izejošajām saitēm.
    • Meklēšanas rezultātu signālu pazemināšana, visticamāk, ir saistīta ar lietotāju neapmierinātības pazīmēm, piemēram, ātru atgriešanos no vietnes.
    • Novērtēts par sliktu navigāciju un lietojamību.
    • Pazemināt precīzās atbilstības domēnus.
    • Zemas kvalitātes produktu atsauksmju noraidīšana.
    • Vietējo vaicājumu atrašanās vietai nepiesaistītu “globālo” lapu pazemināšana uz zemāku versiju.
    • Samazināts 18+ satura rādītājs parastajos meklēšanas rezultātos.
  1. Baltie saraksti. Ir baltie saraksti tādām tēmām kā vēlēšanas, Covid-19 un personīgie emuāri. Daži algoritmi uz tiem neattiecas.
  2. Lietotāju nodomu modeļi. Google izmanto lietotāju nolūku modeļus, piemēram, atkārtotu meklēšanu un klikšķus, lai pielāgotu rangu.
  3. EWOK platforma. Google izmanto kvalitātes vērtēšanas platformu, kurā cilvēki vērtē vietnes. Šie vērtējumi var tieši ietekmēt klasifikāciju.

Sīkāk – pārskatā Maiks Kings un rakstā Rends Fiškins.

Google reakcija

Šo ziņu publicēšanas brīdī Google nebija sniegusi oficiālu komentāru par informācijas noplūdi. Mēs sagaidām, ka uzņēmums stiprinās savu iekšējo datu drošību un, iespējams, veiks izmaiņas savos algoritmos, lai samazinātu noplūdes ietekmi.

Tikmēr SEO speciālisti var salīdzināt savas zināšanas un hipotēzes ar informāciju no noplūdēm un sākt izmantot šos datus savā darbā.

Source link