Tag: Analyse

Neue Stats zum OSM DE Routing View!

Habe heute wieder neue Statistiken zum OSM Routing View erstellen lassen. Schön zu sehen das Insgesamt die Fehleranzahl bei den nicht verbundenen Straßen (1m) zurück geht.

Etwas bedenklich ist allerdings die Entwicklung in Hessen. Dort hat sich die Fehleranzahl von ca. 400 auf quasi über 800 verdoppelt. Mit dem Saarland ist auch das erste Bundesland für den dargestellten Fehlertyp auf 0, Glückwunsch 🙂 ! Spitzenreiter im beseitigen der Fehler sind für den letzten Zeitraum die Länder NRW & RLP. Beide konnten um die 400 Fehler beheben …

Die Analyse läuft jetzt etwas weniger als vier Monate und die Gesamtanzahl der Fehler (nicht verbundene Straßen & doppelte Wege) konnte von über 50.000 auf ca. die Hälfte (25.900) verringert werden!

Immer “mehr” Fehler in OSM DE?

Seit nunmehr vier Monaten setze ich mich mit der Untersuchung der OpenStreetMap (OSM) Daten auseinander. Dabei versuche ich mögliche Fehler im Kontext von Routing in Deutschland zu finden. Ein Ergebnis davon ist der Routing View, der derzeit von skobbler gesponsert wird. In diesem View werden momentan Fehler für Deutschland angezeigt, die durch nicht verbundene oder doppelte Straßen auftreten. Angefangen im März 2010 mit einer Fehleranzahl von mehr als 52.000 konnte die Gesamtanzahl auf momentan (Ende Mai) ca. 32.000 verringert werden.

http://www.flickr.com/photos/lemonpixel/246402687

http://www.flickr.com/ photos/lemonpixel/246402687/

Generell fällt dabei in der Vergangenheit auf, dass sich die Anzahl der Fehler immer nur dann vermehrt verringert, wenn das Thema in der deutschen OSM Maillingliste diskutiert oder angesprochen wird. Wurde nicht über das Thema geschrieben, verkleinerte sich die Anzahl der Fehler auch nicht groß. Zufall oder Wirklichkeit? Eine erste Gegenmaßnahme könnte sein: Mehr Werbung für die Tools machen, damit die Fehler in der OSM Datenbank behoben werden?

Eine zweiter interessanter Punkt ist: Warum werden die Fehler vereinzelt an manchen Tagen nicht weniger sondern manchmal im Gegenteil massiv mehr? Wie kann das sein? Ein gutes Beispiel war hierfür das Wochenende nach einem Feiertag, wo von einem auf den anderen Tag mehr als 2.000 neue Fehler hinzukamen, bei lediglich ca. 12.000 neuen Wegen. Dies würde bedeuten, dass durchschnittlich damals jeder sechster (!!!) neuer Weg einen Fehler beinhaltet oder verursacht hat. Ziemlich viel 🙁

http://farm3.static.flickr.com/2535/4197644976_8092c89fcf.jpg

http://www.flickr.com/photos/45419239@N02/4197644976/in/set-72157623030327270/

Hierbei stellen sich mir unterschiedliche Fragen: Sind die Fehler durch „neue“ Mapper verursacht worden? Liegt es an den OSM-Editoren? Müssten vielleicht bessere oder überhaupt irgendwelche Validierungstools direkt beim Einpflegen der Daten auf mögliche Probleme hinweisen? Manchmal habe ich das Gefühl, dass sich viele Gedanken darüber machen wie sie alles mögliche mappen könnten. Doch dabei kümmern sich anscheinend manche nicht besonders um die Qualität der Daten und vernachlässigen diese. Allgemein finde ich es gut wenn in OSM eine Vielfalt von Daten vorhanden ist oder hinzugefügt wird, aber dabei sollte nicht die Qualität der Daten außer Acht gelassen werden! Oder doch lieber: Quantität statt Qualität?! Manchmal kommt es mir so vor …

Stats OSMI Routing View 2010/05

Hi, seit etwas mehr als zwei Monaten ist der Routing View im OpenStreetMap Inspector online. Dabei zeigt der View Probleme in den OSM Daten, die für Routing und Navigation relevant sind. In den beiden letzten Monaten hatte ich bereits Statistiken über die Deutsche OSM Maillingliste gesendet. Die Mail von März findet ihr hier und die Mail mit den Statistiken im April findet ihr hier. Die nun folgenden Statistiken beziehen sich auf den Zeitraum vom 05.04.2010 bis 10.05.2010. Die Abdeckung des Views ist Deutschland, gemäß des Extrakts der Geofabrik. Der OSM Inspector mit den Routing View kann über folgenden Link aufgerufen werden.

Zu erst ein paar allgemeine Zahlen zum OSMI Routing View (Stand 10.05.2010)
– Gesamtanzahl der OSM Way-Segmente in DE: 7.499.150
– Gesamtanzahl der Problem im OSMI-Routing-View: 36.126
– Anzahl der Probleme im unconnected-Layer: 17.558
– Anzahl der Probleme im duplicate-Layer: 18.538

Statistiken für die Änderungen im Routing View
– Gesamtzuwachs an Way-Segmenten für Routing: +292.969
(Durchschnittlich pro Tag: +8.371 ; Min: +4.888 ; Max: +13.485)
– Differenz in der Gesamtanzahl der Probleme: -2.514
(Durchschnittlich pro Tag: -73 ; Min: +1.066 ; Max: -942)
– Differenz in der Anzahl der Probleme (unconnected): -1.722
(Durchschnittlich pro Tag: -53 ; Min: +160 ; Max: -232)
– Differenz in der Anzahl der Probleme (duplicate): -822
(Durchschnittlich pro Tag: -23 ; Min: +902 ; Max: -626)

Ein ‘+’ bedeutet es wurden an einem Tag kein Problem beseitigt, sondern es kamen nur Neue dazu! Im folgenden Diagramm sind die Anzahl der Fehler für “nicht verbundene Straße 1m” für jedes Bundesland zu sehen. In Nordrhein-Westfalen oder RLP haben sich die Anzahl der Fehler anscheinend nicht verändert oder sind im Gegenteil sogar noch größere geworden 🙁

Dass es auch anders geht zeigen die Mapper aus Thüringen und Baden-Württemberg. In Thüringen wurden 226 Fehler behoben und somit verbleiben dort nur noch 5 Fehler in der “1m”-Kategorie, TOP! Auch die Mapper aus Baden-Württemberg waren aktiv und konnten die Anzahl von 688 auf 196 verringen (-492), ebenfalls gut :o) Wie letzten Monat würde es mal Zeit werden, dass jemand aus den anderen “großen” Bundesländern aktiv werden würde, oder? ;o)