Tag: OSM

Stats OSM Routing View 2010-07

Für die vergangenen fünf Wochen habe ich heute wieder neue Statistiken für den Routing View Deutschland (hier) erstellen lassen. Spitzenreiter im beseitigen möglicher Fehler in der 1m-Klasse ist wie letzen Monat wieder mal das Bundesland Nordrhein-Westfalen (y)

Insgesamt sind inzwischen die Hälfte aller Bundesländer in der 1m-Klasse, wie im Diagramm zu sehen, unter 100 “Fehler”. Drei Bundesländer heben sich momentan aufgrund ihrer hohen Anzahl noch etwas von den anderen ab: Niedersachen, Bayern und Hessen.

Die Gesamtanzahl der Fehler (nichtverbundene & doppelte Straßen) liegt im jetzigen Monat für Deutschland bei ca. 15.000. Was wiederum einer Verminderung innerhalb des letzten Monats von ca. 10.000 “Problemen” entsprechen würde (im Juni waren es insgesamt 25.000) 🙂

Was sehr schön zu sehen ist das die Anzahl der Fehler von doppelten Wegen innerhalb der letzten Zeit sehr stark abgenommen hat. Derzeit verbleiben in Deutschland “nur” noch ca. 2.000 Probleme mit doppelten Wegen …

Auf welche Klassen verteilen sich insgesamt die “Fehler” des Routing Views Deutschland (Juli 2010)?

  • Gesamtanzahl 1m nicht verbunden: 2.700
  • Gesamtanzahl 2m nicht verbunden: 1.500
  • Gesamtanzahl 5m nicht verbunden: 8.600
  • Gesamtanzahl doppelte Ways: 2.000

Nur 1% der User in OSM aktiv?

Im letzten Post habe ich verschiedene “Statistiken” bzgl. der Nutzeraktivität von OSM in Deutschland gezeigt. Manche empfanden das diese “nichts aussagen” oder das “es ja klar ist, das größere oder bevölkerungsstärkere Länder automatisch mehr Edits haben”. Letzteres war zwar im Vorfeld denkbar, wirklich bewiesen hat es aber niemand, oder? Mir ging es eigentlich nicht darum zu zeigen, dass in den größeren Bundesländern in DE mehr los ist, sondern ich wollte vielmehr einmal Zahlen herausfiltern, um damit darzustellen, wie viele Leute denn in jedem Bundesland aktiv an der Karte arbeiten. Ok, etwas “Kritik” könnte man vielleicht am Zeitraum der Analyse (1 Woche) ausüben, es war ein Feiertag dazwischen, aber macht dies wirklich etwas aus? Waren also evtl. an einem Tag mal 50 User mehr oder weniger als einem anderen Tag aktiv? Macht sich das bei einem Mittelwert über eine Woche überhaupt bemerkbar? Da es sich, wie bereits erwähnt, vielmehr um eine “aktuelle” Angabe der aktiven User handelt, denke ich, ist dies hier mal vernachlässigbar. Vielleicht wird OSM.org kommende Woche wieder „geheist“ und dann sehen die Stats bzgl. der User wieder anders aus.

Kommen wir nun zur eigentlichen Frage: Sind weltweit nur 1% der bei OSM registrierten Usern aktiv? Als erstes sollte man unterscheiden, was “aktiv” bedeuten könnte. Ist es auf eine tägliche, wöchentliche oder gar monatliche “Aktivität” des Nutzers bezogen? Da das Tool zum Auswerten des Changefiles vorhanden war, habe ich die Analyse noch einmal für andere Zeiträume durchlaufen lassen. Das folgende Diagramm visualisiert die User-Aktivitäten der “Top 16” Länder für den Zeitraum vom 03.06.-10.06.10 (1 Woche). Die User-Anzahlen wurden jeweils über den Mittelwert der User, die mind. einen Edit im Land pro Tag ausgeführt haben, berechnet. Um in die Liste der “Top 16” aufgenommen zu werden, mussten in dem jeweiligen Land mindestens 20+ User an der Karte gearbeitet haben. Alle anderen Länder, die nicht in den “Top 16” enthalten sind, werden unter „Sonstiges“ gezählt.

Ok, jetzt werden wieder manche sagen “das sagt nichts aus!”. Naja, ich sehe das etwas anders. Hätte man nicht eigentlich erwarten müssen/sollen, dass in den USA um einiges mehr “aktive” User sind? Da wohnen doch so viele … 😉 Woran liegt es, dass es in den USA nicht so gut läuft? Wie bereits im letzen Post erwähnt, ist im Diagramm sehr gut zu erkennen, dass momentan in Deutschland durch die hohe Useranzahl am aktivsten an der Karte gearbeitet wird. Ferner ist ebenfalls ersichtlich das in Frankreich, in Russland und auch in UK jeweils mit knapp über oder unter 100 Usern an der Karte Änderungen erfolgen. Die folgenden Tabellen enthalten jeweils die Anzahl der aktiven User in OSM für weitere Zeiträume:

03.06.-10.06.2010
(pro Tag)
Anzahl User mit mind. einen Edit weltweit: ca. 1.710 (Mittelwert aus der täglichen Anzahl in einer Woche)
03.06.-10.06.2010
(7 Tage / 1 Woche)
Anzahl User mit mind. einen Edit weltweit: ca. 5.700
10.05.-10.06.2010
(31 Tage / 1 Monat)
Anzahl User mit mind. einen Edit weltweit: ca. 13.300

Nimmt man den ersten Mittelwert, die Anzahl der User für einen Tag, würde man bei ca. 1.710 aktiven Usern und einer Anzahl von derzeit grob 260.000 registrierten User über einen Anteil von noch nicht einmal 1% sprechen. Da aber nicht jeder Nutzer täglich aktiv ist, ist dieser Wert sicherlich nicht aussagekräftig. Daher wurde noch einmal die Useranzahl für eine Woche ermittelt, die jeweils mindestens einen Edit innerhalb einer Woche ausgeführt haben. Weltweit kommt dann eine Anzahl von ca. 5.700 zusammen. Dies würde wiederum einem Anteil von ca. 2% entsprechen. Abschließend wurde noch die Useranzahl ermittelt, die jeweils mindestens einen Edit innerhalb eines Monats gemacht haben. Dabei kommt man auf eine Useranzahl von ca. 13.300, was wiederum einem Anteil von ca. 5% entspricht. Dies wäre zumindest der aktive Useranteil, den man des Öfteren auf verschiedenen Konferenzen hört oder im Web liest … Aber trotzdem insgesamt eine nicht so hohe Beteiligung der „Community“ wie man es auf Grund der registrierten User vermuten lassen könnte, oder?

Wo erfolgen die meisten Edits in OSM?

Angeregt durch den vorletzten Post über die „zunehmende“ Anzahl der Fehler in OpenStreetMap DE stellte sich mir die Frage: In welchem Bundesland wird derzeit am meisten an der Map gearbeitet? Aus den daily-Planet-Changefiles für den Zeitraum vom 3.6. bis zum 10.06.2010 (1 Woche) habe ich mal die mittlere Anzahl der Node Edits pro Tag für jedes Bundesland in Deutschland ausgewertet (Edits an Ways sind in diesen Diagrammen (noch) nicht enthalten).

Im Diagramm fallen die drei „großen“ Bundesländer auf. Nordrhein-Westfahlen ist ebenfalls wieder im vorderen Feld der Statistik dabei. Diesmal aber im positiven Sinne 😉 . Bei der Statistik zum Routing View Analyse war es genau andersherum, dort war es das Bundsland mit den meisten Fehlern im Landesvergleich, (vgl. Statistik). Also somit ist NRW das wohl derzeit aktivste Bundesland in OSM DE, aber auch das mit den meisten Fehlern?!

In den Mailinglisten oder auch in den Foren liest man immer wieder eine etwas unterschiedliche Zahle wie groß denn die Beteiligung der deutschen Mapper an der OSM Karte ist. Im folgenden Diagramm sind die Anzahlen der Mapper pro Bundesland für DE für den oben angegeben Zeitraum, die dort einen oder mehrere Edits ausgeführt haben, zu sehen.

Werden die weltweiten OSM Mapper gezählt, so kommt man beim oben genannten Zeitraum von einer Woche auf eine tägliche Durchschnittszahl von ca. 1.710 die jeweils eine oder mehrere Edits an der Map vollbringen. Bei einem Mittelwert in DE von ca. 580 “Mappern” (Usern die in Deutschland an der Map gearbeitet haben) wären dies ca. 34% ! Dies würde bedeuten, dass derzeit ca. 1/3 der weltweiten OSM-Mapper in Deutschland an der Karte arbeiten. Gut für Deutschland, „schlecht“ für die restliche weltweite OSM Karte?

Eine Xls-Tabelle mit den Node Changes pro Tag für Deutschland kann hier heruntergeladen werden.

Neue Stats zum OSM DE Routing View!

Habe heute wieder neue Statistiken zum OSM Routing View erstellen lassen. Schön zu sehen das Insgesamt die Fehleranzahl bei den nicht verbundenen Straßen (1m) zurück geht.

Etwas bedenklich ist allerdings die Entwicklung in Hessen. Dort hat sich die Fehleranzahl von ca. 400 auf quasi über 800 verdoppelt. Mit dem Saarland ist auch das erste Bundesland für den dargestellten Fehlertyp auf 0, Glückwunsch 🙂 ! Spitzenreiter im beseitigen der Fehler sind für den letzten Zeitraum die Länder NRW & RLP. Beide konnten um die 400 Fehler beheben …

Die Analyse läuft jetzt etwas weniger als vier Monate und die Gesamtanzahl der Fehler (nicht verbundene Straßen & doppelte Wege) konnte von über 50.000 auf ca. die Hälfte (25.900) verringert werden!

Immer “mehr” Fehler in OSM DE?

Seit nunmehr vier Monaten setze ich mich mit der Untersuchung der OpenStreetMap (OSM) Daten auseinander. Dabei versuche ich mögliche Fehler im Kontext von Routing in Deutschland zu finden. Ein Ergebnis davon ist der Routing View, der derzeit von skobbler gesponsert wird. In diesem View werden momentan Fehler für Deutschland angezeigt, die durch nicht verbundene oder doppelte Straßen auftreten. Angefangen im März 2010 mit einer Fehleranzahl von mehr als 52.000 konnte die Gesamtanzahl auf momentan (Ende Mai) ca. 32.000 verringert werden.

http://www.flickr.com/photos/lemonpixel/246402687

http://www.flickr.com/ photos/lemonpixel/246402687/

Generell fällt dabei in der Vergangenheit auf, dass sich die Anzahl der Fehler immer nur dann vermehrt verringert, wenn das Thema in der deutschen OSM Maillingliste diskutiert oder angesprochen wird. Wurde nicht über das Thema geschrieben, verkleinerte sich die Anzahl der Fehler auch nicht groß. Zufall oder Wirklichkeit? Eine erste Gegenmaßnahme könnte sein: Mehr Werbung für die Tools machen, damit die Fehler in der OSM Datenbank behoben werden?

Eine zweiter interessanter Punkt ist: Warum werden die Fehler vereinzelt an manchen Tagen nicht weniger sondern manchmal im Gegenteil massiv mehr? Wie kann das sein? Ein gutes Beispiel war hierfür das Wochenende nach einem Feiertag, wo von einem auf den anderen Tag mehr als 2.000 neue Fehler hinzukamen, bei lediglich ca. 12.000 neuen Wegen. Dies würde bedeuten, dass durchschnittlich damals jeder sechster (!!!) neuer Weg einen Fehler beinhaltet oder verursacht hat. Ziemlich viel 🙁

http://farm3.static.flickr.com/2535/4197644976_8092c89fcf.jpg

http://www.flickr.com/photos/45419239@N02/4197644976/in/set-72157623030327270/

Hierbei stellen sich mir unterschiedliche Fragen: Sind die Fehler durch „neue“ Mapper verursacht worden? Liegt es an den OSM-Editoren? Müssten vielleicht bessere oder überhaupt irgendwelche Validierungstools direkt beim Einpflegen der Daten auf mögliche Probleme hinweisen? Manchmal habe ich das Gefühl, dass sich viele Gedanken darüber machen wie sie alles mögliche mappen könnten. Doch dabei kümmern sich anscheinend manche nicht besonders um die Qualität der Daten und vernachlässigen diese. Allgemein finde ich es gut wenn in OSM eine Vielfalt von Daten vorhanden ist oder hinzugefügt wird, aber dabei sollte nicht die Qualität der Daten außer Acht gelassen werden! Oder doch lieber: Quantität statt Qualität?! Manchmal kommt es mir so vor …

Stats OSMI Routing View 2010/05

Hi, seit etwas mehr als zwei Monaten ist der Routing View im OpenStreetMap Inspector online. Dabei zeigt der View Probleme in den OSM Daten, die für Routing und Navigation relevant sind. In den beiden letzten Monaten hatte ich bereits Statistiken über die Deutsche OSM Maillingliste gesendet. Die Mail von März findet ihr hier und die Mail mit den Statistiken im April findet ihr hier. Die nun folgenden Statistiken beziehen sich auf den Zeitraum vom 05.04.2010 bis 10.05.2010. Die Abdeckung des Views ist Deutschland, gemäß des Extrakts der Geofabrik. Der OSM Inspector mit den Routing View kann über folgenden Link aufgerufen werden.

Zu erst ein paar allgemeine Zahlen zum OSMI Routing View (Stand 10.05.2010)
– Gesamtanzahl der OSM Way-Segmente in DE: 7.499.150
– Gesamtanzahl der Problem im OSMI-Routing-View: 36.126
– Anzahl der Probleme im unconnected-Layer: 17.558
– Anzahl der Probleme im duplicate-Layer: 18.538

Statistiken für die Änderungen im Routing View
– Gesamtzuwachs an Way-Segmenten für Routing: +292.969
(Durchschnittlich pro Tag: +8.371 ; Min: +4.888 ; Max: +13.485)
– Differenz in der Gesamtanzahl der Probleme: -2.514
(Durchschnittlich pro Tag: -73 ; Min: +1.066 ; Max: -942)
– Differenz in der Anzahl der Probleme (unconnected): -1.722
(Durchschnittlich pro Tag: -53 ; Min: +160 ; Max: -232)
– Differenz in der Anzahl der Probleme (duplicate): -822
(Durchschnittlich pro Tag: -23 ; Min: +902 ; Max: -626)

Ein ‘+’ bedeutet es wurden an einem Tag kein Problem beseitigt, sondern es kamen nur Neue dazu! Im folgenden Diagramm sind die Anzahl der Fehler für “nicht verbundene Straße 1m” für jedes Bundesland zu sehen. In Nordrhein-Westfalen oder RLP haben sich die Anzahl der Fehler anscheinend nicht verändert oder sind im Gegenteil sogar noch größere geworden 🙁

Dass es auch anders geht zeigen die Mapper aus Thüringen und Baden-Württemberg. In Thüringen wurden 226 Fehler behoben und somit verbleiben dort nur noch 5 Fehler in der “1m”-Kategorie, TOP! Auch die Mapper aus Baden-Württemberg waren aktiv und konnten die Anzahl von 688 auf 196 verringen (-492), ebenfalls gut :o) Wie letzten Monat würde es mal Zeit werden, dass jemand aus den anderen “großen” Bundesländern aktiv werden würde, oder? ;o)