News fallen irgendwann aus Suchmaschine raus. Wie ändern ?

Begonnen von breakdancer, 24 August 2007, 00:50:16

⏪ vorheriges - nächstes ⏩

0 Mitglieder und 1 Gast betrachten dieses Thema.

breakdancer

Hi ihr Lieben,

was ich schon immer mal fragen wollte...

Es geht um die News und Artikel auf meiner Kirmesseite. Mir fällt seit einiger Zeit auf, dass die Newsartikel und Artikel im Newsbereich von den Suchmaschinen nur solange erfasst und gespeichert werden, solange sie tatsächlich auf der Titelseite stehen.

Sobald ein Artikel von der Titelseite verschwindet und quasi in´s Archiv wandert, findet ihn anscheinend auch die Suchmaschine nicht mehr, egal ob Tante Google, Yahoo oder die anderen.

So waren zum Beispiel meine Artikel zum Nürnberger Frühjahrsvolksfest solange noch in den Ergebnissen ganz oben, solange sie auf der Titelseite standen. Nun findet man sie gar nicht mehr. Die Texte sind aber immer noch da und sie sollen auch aufgenommen werden...

Hm. Was da passiert ist klar, aber hat einer eine Idee, wie entweder die Artikel längere Zeit von den Robotz gelesen werden oder wo ich sie unterbringen muss, damit sie wieder gelesen werden ?

Liebe Grüße

Markus


hausmeista

Also ich habe eine Sitemap generiert und diese bei Google-Accounts abgelegt. So sind um die ca. 22.700 Verlinkungen gemeldet und werden auch regelmäßig vom Robot besucht.
siehe hier für meinen Shop (etwas Ladezeit wegen der Größe): http://www.hundesaloon.de/sitemap.xml

Zusätzlich das regelmäßige Eintragen in relevante Suchmaschinen. So findet man meinen Artikel aus der Hundezeitung vom 06. März 2006 noch immer. Dazu einfach mal zum Thema Hundekrankheiten den Begriff Aassüchtigkeit bei Google eingeben ...
Heiko Richter: In Deutschland muss man arbeiten wie ein Pferd um zu verdienen wie ein Pony.
PMX Shop-Modul unter www.vcardo.de

siggi

ZitatHm. Was da passiert ist klar, aber hat einer eine Idee, wie entweder die Artikel längere Zeit von den Robotz gelesen werden oder wo ich sie unterbringen muss, damit sie wieder gelesen werden ?

Na dann lies mal das hier : Wie erhalten Suchmaschinen ihre Daten  : http://www.drweb.de/suchmaschinen/daten.shtml
Wenn man an Gras zieht wächst es auch nicht schneller.

breakdancer

#3
Hi Leute,

ja, das ist schon alles ganz ganz klar. Meine Website ist seit einigen Jahren auf vielen vielen Suchmaschinen eingetragen, teils per Eintragungsdienst, teils aber auch in mühevoller Kleinarbeit händisch - und es hat grundsätzlich auch zu entsprechenden Ergebnissen geführt. Passt also schon. Das Optimieren meiner Webseite für die Suchmaschinen war mit schon immer sehr sehr wichtig.

Das was Hausmeista da geschrieben hat, ist glaube ich genau der Knackpunkt. Ich habe die von PragmaMX verwendete Google-Sitemap verwendet, im Hauptverzeichnis abgelegt und die Seite ebenfalls bei Google-Analytics abgelegt. Wobei mir dieser Dienst aufgrund diverser Vorwürfe, die User in gewisser Weise auszuspionieren, nicht wirklich gefällt. Dennoch fehlen die News Artikel der vergangenen Monate in der Auflistung von Google.

Ich werde mir jetzt mal die Sitemap von Hausmeista nochmal anschauen, vielleicht entdecke ich ja was neues für mich. Ansonsten äußert euch doch bitte nochmal zum Thema Sitemap.

Liebe Grüße

Markus


EDIT: Hausmeista, was is´n das für ein hammer bequemes Tool ???
Wie krass, ich glaube, Du hast mir schon ganz doll weitergeholfen. Der GSiteCrawler beackert grad meine Site, jetzt werd ich das doch mal ausprobieren !

Vielen Dank !

Manuel

Das Tool hab ich gestern auch durch Zufall mal getestet aber bei mir hat er auch Seiten ohne mod_rewrite Überschreibung gecrawlt. Sprich die ganzen Seiten die mit modules=News und so weiter anfangen.

Fand ich bissl doof. Hab da immer Bange vor doppelten Content.
Mein pragmaMx -> Berufswahl-Online.de

Andi

Moin :)

wenn es nur um die News geht, die im Google Index bleiben sollen, dann kann man das auch in der mitgelieferten Google-Sitemap beeinflussen.

Schaut da einfach mal rein...

Dort gibt es die Variable $limit, die die Anzahl und damit auch automatisch den Zeitraum der gelisteten Artikel einschränkt. Die einfach erhöhen.
Nachteil dabei ist, dass alle Module dadurch beeinflusst werden. Wer das nur für die Artikel erhöhen will, der kann das weiter unten in der Funktion stories(), manuell beeinflussen, in dem er bei $limit eine feste Zahl einträgt....
schön´s Grüssle, Andi

hausmeista

@breakdancer  @Manuel
Bitte nicht vergessen die Filter für Session-Id's usw. zu prüfen und gegebenenfalls zu erweitern. Bitte unbedingt die eingestellten Crawler bis zum Schluß durcharbeiten lassen und erst dann die Überprüfung und Löschung nicht erreichbarer Links starten. Und ganz Wichtig: Bitte die nicht zu durchsuchenden Verzeichnisse aktualisieren. Ich glaube auch, dass im Gegensatz zur ELMAR Datei diese Sitemap nicht automatisiert aktualisiert wird - schade eigentlich ;-)

@Andi
vielen Dank für den Tipp..
Heiko Richter: In Deutschland muss man arbeiten wie ein Pferd um zu verdienen wie ein Pony.
PMX Shop-Modul unter www.vcardo.de

breakdancer

Zitat von: Andi am 24 August 2007, 10:49:28
Dort gibt es die Variable $limit, die die Anzahl und damit auch automatisch den Zeitraum der gelisteten Artikel einschränkt. Die einfach erhöhen.

Hi Andi,

die MX-eigene Sitemap habe ich ja auch immer benutzt, das Limit für alle Artikel und Sachen steht und stand bei mir schon immer auf 1.500 Stück, trotzdem sind meine News rausgefallen, sobald sie nicht mehr auf der Titelseite standen. Ist schon bissl seltsam... Was mache ich denn falsch ?

@hausmeista:

Das Tool ist bei mir etwa acht Stunden gelaufen, hat 13.000 Seiten gefunden, ohne dass ich die Filter geändert habe oder so... Ich muss mich da nochmal reinlesen, wie es genau funktioniert, mit ist das nämlich auch grad net ganz koscher, obwohl ich mir sicher bin, wenn man richtig damit umgeht, ist es ein hammer Tool, wie schon gesagt...

Liebe Grüße

Markus

breakdancer

Hi,

kurzer Zwischenstand... Also als erstes Mal musste ich meinen alten Google-Account überraschenderweise erstmal wieder reaktivieren, die Sitemap-Angaben, die früher mal drinstande, waren in der Zwischenzeit verschwunden und keine mehr aktiv. Ich habe die PMX-Sitemap wieder aktiviert und bekomme derzeit genau 1060 Links angezeigt. Keine Ahnung ob das okay ist, mit dem G-Site-Crawler hatte ich nach drei Stunden Laufzeit bereits über 12.000 Einträge. Hab das aber abgebrochen, da ich mich mit den Einstellungen nicht auskenne. Muss mich da nochmal reinlesen.

Bin jetzt bissl verunsichert, was das ursprüngliche Thema angeht: die alten News, die irgendwann aus den Suchmaschinen verschwunden sind... Irgendetwas stimmt einfach nicht, komisch ist das.

Wo könnte ich eigentlich überall ein "nofollow" finden ? Nicht dass da irgendwo in einer .html-Datei eins in den Tags drinnesteht...

Gruss

Markus

hausmeista

@breakdancer

ja sicher benötigt der eine weile für mittelgroße bis große Sites. Möchte selber nicht wissen wie das dauern soll wenn ich mal alle Artikel drin habe ;-)

Letztendlich bleibt es immer an der Konfiguration hängen, so wie Du einstellst arbeitet der auch - logisch oder. Da er sämtliche Verknüpfungen aufnimmt die er zu greifen bekommt, so auch die Bilder, muss also genau abgewägt werden was er veröffentlichen darf und was nicht. Ich habe zum Beispiel den Robots Generator mit genutzt, da hat er meine Einstellungen / Beschränkungen gleich mit aufgearbeitet.

Als letzten Tipp hätte ich noch die Recherche nach guten "Lieferanten" Deiner Links von anderen Seiten. Setze Dich mit denen in Verbindung und handle gute Konditionen aus, so das beide Parteien davon profitieren können. Und dann funktioniert das auch. Am pragmaMx kann das nicht liegen, denke ich, denn ich bin erst seit diesem Monat mit meinem Online und bei 587.000 Ergebnissen bei Google auf Seite 3 und wenn ich das Suchwort banner mit Leerzeichen dahinter setze kommen um die 63.000 Einträge, hier bin ich auf Seite 2. Vielleicht solltest Du den Ratschlag von Andy dir noch mal ansehen:
http://www.pragmamx.org/Forum-topic-22436-start-msg150820.html#msg150820
Heiko Richter: In Deutschland muss man arbeiten wie ein Pferd um zu verdienen wie ein Pony.
PMX Shop-Modul unter www.vcardo.de