Nekem van csak olyan erzesem, hogy a google-val nem lehet mar a drupal.hu forumban ertelmesen keresni?
az ilyen gyujtooldalak mind be vannak linkelve:
drupal.hu/forum/temak/modulok-használata?page=17
drupal.hu/tracker?page=18&order=comment_count&sort..
drupal.hu/tracker/user-content/pp?order=name&sort=asc...
drupal.hu/taxonomy/term/3?page=38&from=100
drupal.hu/planet?page=5nem tehetnenk ra szurot, hogy ezeket az utvonalakat ne indexelje, es lehetoleg csak direkt node talalatok maradjanak?
masik kerdes: meg lehet azt oldani, hogy csak a node content legyen indexelve, mert az "aktiv forumtemak" es a "friss hozzaszolasok" blokk is eleg erosen bekavar..
A robots.txt megfelelő beállításával el lehet érni, hogy bizonyos url-ek kimaradjanak.
Van hozzá modul, ez a legegyszerűbb, hogy az indexből kitiltani azon oldalakat, amelyek nem kellenek. http://drupal.org/project/robotstxt
A blokkok viszont az oldal részei... talán van tag arra, hogy bizonyos oldal részeket ne vegyen figyelembe az indexelő robot.
A noidex external link modul beállítás oldaláról néhány info hirtelen:
* Wrap links with tag .
NOINDEX tag is used to deny indexing part of page. Only Yandex and Rambler considers this tag but Google and others doesn't. There is also an attribute NOINDEX in meta-tag Robots.
+ a noindex beállításai:
*Simple: <noindex>
This is a default. NOINDEX-tag isn't a valid HTML-tag. It was created by Yandex and used also by Rambler. Google ignore this tag. HTML-validators considers this tag as mistake so your pages will not pass HTML-validation.
* Valid: <span style="display: none"><![CDATA[<noindex>]]></span>
Using this trick your pages will pass HTML-validation
Érdemes lenne utána kutakodni kicsit bővebben.
--
Szabó Dénes - http://internode.hu - webfejlesztés
de hogy ezért semmilyen modult nem fogunk feltenni, abban szinte biztos vagyok. :) kézzel is be lehet írni a robots.txt -be bármit egyébként. azt tartom a legegyszerűbb és leggyorsabb megoldásnak, hogy a komplett trackert tiltjuk a névteleneknek.
a friss hozzászólások blokk értéke elég kevés szerintem, senkinek nem fog hiányozni, ha levesszük onat. a követett dolgaim meg a látnom kell csak azonosítottaknak jelenik meg eleve. az egyetlen kérdéses az aktív fórumtémák. én azt se használom soha, szóval felőlem az is mehet a levesbe.
mi legyen?
-
clear: both;
ha levesszük az aktiv forumtemakat akkor valami static szoveget otthagyhatnank, hogy a friss temakert latogasd meg a tracker oldalt vagy valami hasonlot, mert aki !drupalos az tuti nem fogja elsore megtalalni azt.
---
Tévedni mindenkinek szabad, csak a mérnöknek észre kell vennie.
a komplett trackert tiltjuk a névteleneknek, hogy a robot ne tudja leindexelni. (és amúgy is, névtelenül mi értelme a trackernek? sose értettem)
ugyan ezt megcsinálhatjuk az aktív fórumtémák blokkal is, névteleneknek nem hiszem, hogy hiányozni fog. fene tudja.
-
clear: both;
is meg lehet írni kézzel, még se tesszük... :)
Mondjuk az igaz: robots.txt szerkesztésre igenritkán van szükség, a modul csak kényelmes.
--
Szabó Dénes - http://internode.hu - webfejlesztés
vagy tilthatjuk a tracker nézetet névteleneknek. (én ezt javasolnám)
utóbbi könnyű, előbbihez cvs hozzáférés kell.
blokkokkal is lehet bűvészkedni, de a noindexet úgyse veszi figyelembe a google, szóval mindegy is. de akár itt is el lehet játszani azt, hogy csak regisztráltaknak mutatjuk a blokkot.
persze mire ezek a találatok 'kikopnak' az indexből, az nem holnap lesz :)
-
clear: both;
ha lenne rajta valami http error code akkor eleg gyorsan kikopik
301 Moved Permanently
403 Forbidden
410 Gone
az egyik weboldalon amin dolgoztam egy 403-as ami korabban kiemelt al-link volt a google-ban eltunt egy honapon belul.
hogy állítok be úgy egy nézetet (vagy egy útvonalat), hogy regisztráltnak a nézet jöjjön, nem regisztráltnak meg 410? megcsinálom szívesen!
-
clear: both;
sajat modullal a path_redirect alapjan.
403at tudsz eloallitani ha megadsz jogosultsagot a nezetnek.
de eloszor ossze kellene irni, hogy mely gyujtooldalakat ne indexelje a google, es ki kellene talalni a legmegfelelobb modszert is hozza..
kerdes: ha a /planet es a /feed-items oldalakat nem adjuk a google-nak attol meg meg fogja talalni az egyes planet node-okat?
A tipp az, hogy igen, ha nem tiltjatok a robots.txt-ben is. Elvben ugyanis ha valaki belinkel egy oldalt, es az letoltheto valamint nem tiltott a robotoknak, akkor indexelodik. Ezert van pl. hogy adott esetben a images mappa nem listazhato, de ettol az images/valami.png meg bekerul az indexbe.
--
()=() Ki oda vagyik, ('Y') hol szall a galamb C . C elszalasztja a ()_() kincset itt alant.