Romlo google talalatok

Pasqualle képe

Nekem van csak olyan erzesem, hogy a google-val nem lehet mar a drupal.hu forumban ertelmesen keresni?

az ilyen gyujtooldalak mind be vannak linkelve:

drupal.hu/forum/temak/modulok-használata?page=17
drupal.hu/tracker?page=18&order=comment_count&sort..
drupal.hu/tracker/user-content/pp?order=name&sort=asc...
drupal.hu/taxonomy/term/3?page=38&from=100
drupal.hu/planet?page=5

de sajnos a keresett szo szinte sose talalhato meg mar rajta, mivel jopar oldallal arrebb lesz mar valahol..

nem tehetnenk ra szurot, hogy ezeket az utvonalakat ne indexelje, es lehetoleg csak direkt node talalatok maradjanak?

masik kerdes: meg lehet azt oldani, hogy csak a node content legyen indexelve, mert az "aktiv forumtemak" es a "friss hozzaszolasok" blokk is eleg erosen bekavar..

Fórum: 
Den képe

A robots.txt megfelelő beállításával el lehet érni, hogy bizonyos url-ek kimaradjanak.
Van hozzá modul, ez a legegyszerűbb, hogy az indexből kitiltani azon oldalakat, amelyek nem kellenek. http://drupal.org/project/robotstxt

A blokkok viszont az oldal részei... talán van tag arra, hogy bizonyos oldal részeket ne vegyen figyelembe az indexelő robot.

A noidex external link modul beállítás oldaláról néhány info hirtelen:

* Wrap links with tag .
NOINDEX tag is used to deny indexing part of page. Only Yandex and Rambler considers this tag but Google and others doesn't. There is also an attribute NOINDEX in meta-tag Robots.

+ a noindex beállításai:

*Simple: <noindex>
 
This is a default. NOINDEX-tag isn't a valid HTML-tag. It was created by Yandex and used also by Rambler. Google ignore this tag. HTML-validators considers this tag as mistake so your pages will not pass HTML-validation.
 
* Valid: <span style="display: none"><![CDATA[<noindex>]]></span>
Using this trick your pages will pass HTML-validation

Érdemes lenne utána kutakodni kicsit bővebben.

0
0
aboros képe

de hogy ezért semmilyen modult nem fogunk feltenni, abban szinte biztos vagyok. :) kézzel is be lehet írni a robots.txt -be bármit egyébként. azt tartom a legegyszerűbb és leggyorsabb megoldásnak, hogy a komplett trackert tiltjuk a névteleneknek.

a friss hozzászólások blokk értéke elég kevés szerintem, senkinek nem fog hiányozni, ha levesszük onat. a követett dolgaim meg a látnom kell csak azonosítottaknak jelenik meg eleve. az egyetlen kérdéses az aktív fórumtémák. én azt se használom soha, szóval felőlem az is mehet a levesbe.

mi legyen?

0
0

-
clear: both;

gergely képe

ha levesszük az aktiv forumtemakat akkor valami static szoveget otthagyhatnank, hogy a friss temakert latogasd meg a tracker oldalt vagy valami hasonlot, mert aki !drupalos az tuti nem fogja elsore megtalalni azt.

0
0

---
Tévedni mindenkinek szabad, csak a mérnöknek észre kell vennie.

aboros képe

a komplett trackert tiltjuk a névteleneknek, hogy a robot ne tudja leindexelni. (és amúgy is, névtelenül mi értelme a trackernek? sose értettem)

ugyan ezt megcsinálhatjuk az aktív fórumtémák blokkal is, névteleneknek nem hiszem, hogy hiányozni fog. fene tudja.

0
0

-
clear: both;

Den képe

is meg lehet írni kézzel, még se tesszük... :)

Mondjuk az igaz: robots.txt szerkesztésre igenritkán van szükség, a modul csak kényelmes.

0
0
aboros képe

vagy tilthatjuk a tracker nézetet névteleneknek. (én ezt javasolnám)
utóbbi könnyű, előbbihez cvs hozzáférés kell.

blokkokkal is lehet bűvészkedni, de a noindexet úgyse veszi figyelembe a google, szóval mindegy is. de akár itt is el lehet játszani azt, hogy csak regisztráltaknak mutatjuk a blokkot.

persze mire ezek a találatok 'kikopnak' az indexből, az nem holnap lesz :)

0
0

-
clear: both;

Pasqualle képe

ha lenne rajta valami http error code akkor eleg gyorsan kikopik
301 Moved Permanently
403 Forbidden
410 Gone

az egyik weboldalon amin dolgoztam egy 403-as ami korabban kiemelt al-link volt a google-ban eltunt egy honapon belul.

0
0
aboros képe

hogy állítok be úgy egy nézetet (vagy egy útvonalat), hogy regisztráltnak a nézet jöjjön, nem regisztráltnak meg 410? megcsinálom szívesen!

0
0

-
clear: both;

Pasqualle képe

sajat modullal a path_redirect alapjan.
403at tudsz eloallitani ha megadsz jogosultsagot a nezetnek.

de eloszor ossze kellene irni, hogy mely gyujtooldalakat ne indexelje a google, es ki kellene talalni a legmegfelelobb modszert is hozza..

kerdes: ha a /planet es a /feed-items oldalakat nem adjuk a google-nak attol meg meg fogja talalni az egyes planet node-okat?

0
0
hron84 képe

A tipp az, hogy igen, ha nem tiltjatok a robots.txt-ben is. Elvben ugyanis ha valaki belinkel egy oldalt, es az letoltheto valamint nem tiltott a robotoknak, akkor indexelodik. Ezert van pl. hogy adott esetben a images mappa nem listazhato, de ettol az images/valami.png meg bekerul az indexbe.

0
0

--

()=() Ki oda vagyik,
('Y') hol szall a galamb
C . C elszalasztja a
()_() kincset itt alant.