Nekem van csak olyan erzesem, hogy a google-val nem lehet mar a drupal.hu forumban ertelmesen keresni?
az ilyen gyujtooldalak mind be vannak linkelve:
drupal.hu/forum/temak/modulok-használata?page=17 drupal.hu/tracker?page=18&order=comment_count&sort.. drupal.hu/tracker/user-content/pp?order=name&sort=asc... drupal.hu/taxonomy/term/3?page=38&from=100 drupal.hu/planet?page=5
de sajnos a keresett szo szinte sose talalhato meg mar rajta, mivel jopar oldallal arrebb lesz mar valahol..
nem tehetnenk ra szurot, hogy ezeket az utvonalakat ne indexelje, es lehetoleg csak direkt node talalatok maradjanak?
masik kerdes: meg lehet azt oldani, hogy csak a node content legyen indexelve, mert az "aktiv forumtemak" es a "friss hozzaszolasok" blokk is eleg erosen bekavar..
Fórum:
robots.txt-vel
A robots.txt megfelelő beállításával el lehet érni, hogy bizonyos url-ek kimaradjanak.
Van hozzá modul, ez a legegyszerűbb, hogy az indexből kitiltani azon oldalakat, amelyek nem kellenek. http://drupal.org/project/robotstxt
A blokkok viszont az oldal részei... talán van tag arra, hogy bizonyos oldal részeket ne vegyen figyelembe az indexelő robot.
A noidex external link modul beállítás oldaláról néhány info hirtelen:
* Wrap links with tag .
NOINDEX tag is used to deny indexing part of page. Only Yandex and Rambler considers this tag but Google and others doesn't. There is also an attribute NOINDEX in meta-tag Robots.
+ a noindex beállításai:
Érdemes lenne utána kutakodni kicsit bővebben.
--
Szabó Dénes - Internode.hu - Munkára fogott weblapok
bár ez nem az én döntésem,
de hogy ezért semmilyen modult nem fogunk feltenni, abban szinte biztos vagyok. :) kézzel is be lehet írni a robots.txt -be bármit egyébként. azt tartom a legegyszerűbb és leggyorsabb megoldásnak, hogy a komplett trackert tiltjuk a névteleneknek.
a friss hozzászólások blokk értéke elég kevés szerintem, senkinek nem fog hiányozni, ha levesszük onat. a követett dolgaim meg a látnom kell csak azonosítottaknak jelenik meg eleve. az egyetlen kérdéses az aktív fórumtémák. én azt se használom soha, szóval felőlem az is mehet a levesbe.
mi legyen?
-
clear: both;
ha levesszük az aktiv
ha levesszük az aktiv forumtemakat akkor valami static szoveget otthagyhatnank, hogy a friss temakert latogasd meg a tracker oldalt vagy valami hasonlot, mert aki !drupalos az tuti nem fogja elsore megtalalni azt.
---
Tévedni mindenkinek szabad, csak a mérnöknek észre kell vennie.
na, így
a komplett trackert tiltjuk a névteleneknek, hogy a robot ne tudja leindexelni. (és amúgy is, névtelenül mi értelme a trackernek? sose értettem)
ugyan ezt megcsinálhatjuk az aktív fórumtémák blokkal is, névteleneknek nem hiszem, hogy hiányozni fog. fene tudja.
-
clear: both;
A komplett weblapot
is meg lehet írni kézzel, még se tesszük... :)
Mondjuk az igaz: robots.txt szerkesztésre igenritkán van szükség, a modul csak kényelmes.
--
Szabó Dénes - Internode.hu - Munkára fogott weblapok
letilthatjuk a robots -ban,
vagy tilthatjuk a tracker nézetet névteleneknek. (én ezt javasolnám)
utóbbi könnyű, előbbihez cvs hozzáférés kell.
blokkokkal is lehet bűvészkedni, de a noindexet úgyse veszi figyelembe a google, szóval mindegy is. de akár itt is el lehet játszani azt, hogy csak regisztráltaknak mutatjuk a blokkot.
persze mire ezek a találatok 'kikopnak' az indexből, az nem holnap lesz :)
-
clear: both;
kikopnak
ha lenne rajta valami http error code akkor eleg gyorsan kikopik
301 Moved Permanently
403 Forbidden
410 Gone
az egyik weboldalon amin dolgoztam egy 403-as ami korabban kiemelt al-link volt a google-ban eltunt egy honapon belul.
oké, hogyan?
hogy állítok be úgy egy nézetet (vagy egy útvonalat), hogy regisztráltnak a nézet jöjjön, nem regisztráltnak meg 410? megcsinálom szívesen!
-
clear: both;
talaljuk ki hogyan
sajat modullal a path_redirect alapjan.
403at tudsz eloallitani ha megadsz jogosultsagot a nezetnek.
de eloszor ossze kellene irni, hogy mely gyujtooldalakat ne indexelje a google, es ki kellene talalni a legmegfelelobb modszert is hozza..
kerdes: ha a /planet es a /feed-items oldalakat nem adjuk a google-nak attol meg meg fogja talalni az egyes planet node-okat?
A tipp az, hogy igen, ha nem
A tipp az, hogy igen, ha nem tiltjatok a robots.txt-ben is. Elvben ugyanis ha valaki belinkel egy oldalt, es az letoltheto valamint nem tiltott a robotoknak, akkor indexelodik. Ezert van pl. hogy adott esetben a images mappa nem listazhato, de ettol az images/valami.png meg bekerul az indexbe.
--