| M | D | M | D | F | S | S |
|---|---|---|---|---|---|---|
| « Jan | ||||||
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 | |||
Hinterfragenswerter Bericht bei Heute.de mit der Thematik wieviele Seiten durch Google und Yahoo erfasst/gecrawlt sind (und zu dem zugehörigen PR-Krieg), bzw. über die eigentliche Größe des WWW, welches sich in das “surface web” (das “Oberflächen-Web”, welches von Suchmaschinen erfassbar ist) und das “deep web” (das “tiefe Web” welches nicht erfassbar für Suchmaschinen ist) unterteilt.
Zitat [
]
… das Deep Web – ja wo isses denn?
Hinterfragenswerter Bericht bei Heute.de mit der Thematik wieviele Seiten durch Google und Yahoo erfasst/gecrawlt sind (und zu dem zugehörigen PR-Krieg), bzw. über die eigentliche Größe des WWW, welches sich in das “surface web” (das “Oberflächen-Web”, welches von Suchmaschinen erfassbar ist) und das “deep web” (das “tiefe Web” welches nicht erfassbar für Suchmaschinen ist) unterteilt.
Zitat von heute.de:
“Informationen aus dem Deep Web sind in der Regel aktueller, thematisch enger fokussiert und damit relevanter”, sagt der Chef von BrightPlanet, Duncan Witte, zu heute.de. Nach seinen Schätzungen enthalten allein die 60 größten Sites des Deep Web eine Datenmenge, die etwa 85 Milliarden Webseiten entspricht, etwa dem Zehnfachen des Google-Indexes. “Wir wissen von circa 150.000 Sites im Deep Web mit nutzbarem Content”, so Witte.
Das Größenverhältnis zwischen Deep Web und Surface Web schätzt er sogar auf 500:1.
Scheint mir zwar etwas übertrieben, aber durchaus denkbar.
Allerdings frage ich mich, wo denn diese 60 größten Sites des Deep Web versteckt sein sollen, die insgesamt größer sind als der gesamte aktuelle Google-Index?
Falls jemand eine dieser, bei Google und anderen Suchmaschinen, nicht erfassten angesprochenen Mega-Sites des Deep Web kennt, bitte nen Link dazu in die Kommentare packen – Danke …;-))
Auch die Argumentation:
Hauptproblem der Suchmaschinen ist dabei, dass immer mehr Websites nicht mehr aus statischen Seiten bestehen, sondern mit Datenbanken betrieben werden, die die jeweilige Seite erst auf Abruf durch einen Nutzer dynamisch generieren. Immer mehr dieser dynamisch generierten Inhalte bleiben für die Crawler unauffindbar oder nicht katalogisierbar.
… ist für mich nicht wirklich nachvollziehbar, da Google bereits seit Jahren dynamischen Content erfasst und dies auch fortlaufend ausweitet. Mittlerweile erfasst Google sogar sicherheitsgeschützte dynamische Sites, die der Crawler oft gar nicht erfassen soll, wie z.B. “https” Sites …;-)
Falls jemand versteht, was diese amerikanischen “SEO-Experten” mit den nicht erfassbaren “dynamischen Inhalten” nun wieder gemeint haben könnten, wäre ich auch dazu für nen Denkanstoss zu haben …;-)
Andere Beiträge mit ähnlichen Inhalten, die Dich evtl. auch interessieren könnten:
- Google Chaos & Deepweb/Ajax Exkursionen
- Viren & Trojaner hinter Sponsored Links versteckt
- Suchmaschinen Verbindungen
- Google Page Creator
- the dark side of the web – XSS for SEO
- PageRank Update für Lemminge
- Google Top-10 mit SEO-Tools
Den Artikel " … das Deep Web – ja wo isses denn? " bei SEOigg eintragen:
Der Artikel " … das Deep Web – ja wo isses denn? " enthält 305 Wörter.
Artikel mit verwandten Tags (Keywords, Suchbegriffe)
Am 19.01.06, 16:14 in Google SEO by Frank veröffentlicht.
RSS Feed für Kommentare.
Du kannst hier kommentieren oder hier per Trackback von Deinem Blog aus "verewigen".
· Gelesen: 4583 · heute: 4
4 Kommentare zu "… das Deep Web – ja wo isses denn?"
-
19.01.06 um 18:06:25
Ich vermute, dass mit den “versteckten” Inhalten u.a. passwortgeschützte Bereiche etc. gemeint sind. Vermutlich zählen auch Statistiken und andere dynamisch erzeugte Inhalte dazu. So könnte z.B. ein PHP-Taschenrechner quasi unendlich viele Einzelseiten generieren. Ob es jedoch sinnvoll für SuMas ist solche Inhalte aufzunehmen, sehe ich als fraglich an.
-
PS: mit u.a. war “unter Anderem” gemeint ;-)




