Tag: Qualität

A comparative study between different OpenStreetMap contributor groups – Outline 2016

Over the past few years I have written several blog posts about the (non-) activity of newly registered OpenStreetMap (OSM) members (2015, 2014, 2013). Similarly to the previous posts, the following image shows the gap between the number of registered and the number of active OSM members. Although the project still shows millions of new registrations, “only” several hundred thousand of these registrants actually edited at least one object. Simon showed similar results in his yearly changeset studies.

2016members

The following image shows, that the project still has some loyal contributors. More specifically, it shows the increase in monthly active members over the past few years and their consistent data contributions based on the first and latest changeset:

2016months

However, this time I would like to combine the current study with some additional research. I tried to identify three different OSM contributor groups, based on the hashtag in a contributor’s comment or the utilized editor, for the following analysis:

Routing View EU 2011-01

Overall the following amount of errors appears for “Europe” at the middle of January 2011:

  • Unconnected Roads: ca. 109600
  • Duplicate Ways (number of duplicate segments): ca. 125900
  • (read more about the error-types here)

This means that altogether there are 3000 unconnected streets and 13400 duplicate way segment errors have been fixed (last month we had 112600 unconnected roads and 139000 duplicate ways errors). In total we have an increment of 1139000 (+3.8%) new OSM way segments for routing during the past 4 weeks in Europe!

  • 12/23/2010: 29400000
  • 01/20/2011: 30600000

The following image shows the amount of errors divided by country for today’s Europe OpenStreetMap dataset:

In the past month several other countries were able to reduce the amount of errors, such as in: France (-2900), Portugal (-2900) and Romania (-2200). So I think the award for this month goes to Portugal 🙂 (Is the reduction a result of this action? However, nice work!). But further countries such as Albania, Belgium, Bosnia and Herzegovina, Bulgaria, Germany, Greece, Slovakia and Sweden were able to reduce more than 1000 errors each. Only Spain (+1200) and the United Kingdom (+2000) have a gained more errors!

Routing View EU 2010-12

Short update with new statistics for the “Routing View EU“. Overall the following amount of errors appears for “Europe” at the middle of December 2010:

  • Unconnected Roads: ca. 112600
  • Duplicate Ways (number of duplicate segments): ca. 139000
  • read more about the error-types here

This means that altogether there are 5100 new unconnected streets and 20000 duplicate way segment errors have been fixed (last month we had 107500 unconnected roads and 160000 duplicate way errors). In total we have an increment of 1300000 (+4.6%) new OSM way segments for routing in the past 5 weeks in “Europe” (this is nearly twice the number in comparison to one month ago)!

The following image shows the amount of errors divided by country for today’s Europe dataset:

In the past month several other countries were able to reduce the amount of errors, such as in: Austria (-3200), France (-4400), Italy (-2100), Portugal (-1200), Sweden (-2000), Switzerland (-4828 !!) and the United Kingdom (-3700). So I think the award for this month goes to Switzerland 🙂 . Germany keeps going on with its negative trend: A gain of about 2700 errors! It seems like the German OSM community is primarly tracing from Bing-imagerys, doesn´t it?

Routing View EU 2010-11

And again, here are the new statistics for the “Routing View EU“.

Overall (according to the Geofabrik extract) the following amount of errors appear for Europe at the middle of November 2010:

  • Unconnected Roads: ca. 107500
  • Duplicate Ways (number of duplicate segments): ca. 160000

Unfortunately this means that overall only 500 unconnected streets and 22000 duplicate way segment errors have been fixed (last month we had 108000 unconnected roads and 180000 duplicate way segments errors). As always, the following image shows the amount of errors divided by country:

Wow Italy! It’s really nice to see what’s happening there! During the past month they fixed more than 9000 errors again. And now they are really catching up with Germany 🙂 But also in several other countries some people were able to reduce the amount of errors too, such as in: Albania, Denmark, Greece, Iceland, Norway or Sweden. More than 1000 errors have been fixed here in each country 🙂

Routing View EU 2010-10

As mentioned in my last post, I am trying to conduct some statistics for the “Routing View EU” each month that show the areas where the amounts of errors have changed.

Over all (according to the Geofabrik extract) the following amounts of errors appear for the area of Europe at the moment:

  • Unconnected Roads: ca. 108000
  • Duplicate Ways (number of duplicate segments): ca. 182000

This means that compared to last month about 3000 unconnected streets and 31000 duplicate way segment errors have been removed in Europe. The following image shows the amount of errors divided by country:

If Italy keeps up the good work (-11000 errors) it will catch up with Germany in one or two months. But also Austria, France and Norway were able to correct a lot of errors. For some reason the United Kingdom does not show much of a difference and still has a high amount of errors!?

“Unmapped” Places in DE?

Gerade vergangene Woche wurde in der Presse wieder über OpenStreetMap und dessen Datenqualität (Vollständigkeit) gesprochen. Beispielsweise gab es hier (Golem) einen Artikel: “OpenStreetMap ist reif für den geschäftlichen Einsatz”. Ich finde das diese Aussage aber differenziert betrachten werden muss, für was genau die Daten verwendet werden sollen. Für Kartendarstellungen, Geomarketing und/oder Autonavigation? Für welches Land? Wie auch immer, Qualitätsuntersuchungen gibt es schon länger und sie zeigen auch, das sich die Qualität (Vollständigkeit) von Region zu Region unterscheiden kann.

Letzte Woche bin ich eher durch Zufall auf folgende OSM-Wiki-Seite gestoßen: “Quality Assurance”. Sie zeigt eine gute Übersicht von verschiedenen für OSM wichtigen Qualitäts-Tools. Unter anderem fand ich dort auch von Gary68 das Tool “Unmappedplaces”. Die Idee hinter diesem Tool fand ich interessant: Es versucht für ein OSM-File alle “potenziell unkartografierte Places” zu finden. Die Ergebnisse in meiner Region waren allerdings nicht so, das die Places die ich ebenfalls kennzeichnen würde, auch gefunden wurden. Deswegen habe ich versucht das Ganze “neu” zu machen. Für Deutschland kam dabei mein Tool auf folgende Ergebnisse.

Stats OSM Routing View 2010-07

Für die vergangenen fünf Wochen habe ich heute wieder neue Statistiken für den Routing View Deutschland (hier) erstellen lassen. Spitzenreiter im beseitigen möglicher Fehler in der 1m-Klasse ist wie letzen Monat wieder mal das Bundesland Nordrhein-Westfalen (y)

Insgesamt sind inzwischen die Hälfte aller Bundesländer in der 1m-Klasse, wie im Diagramm zu sehen, unter 100 “Fehler”. Drei Bundesländer heben sich momentan aufgrund ihrer hohen Anzahl noch etwas von den anderen ab: Niedersachen, Bayern und Hessen.

Die Gesamtanzahl der Fehler (nichtverbundene & doppelte Straßen) liegt im jetzigen Monat für Deutschland bei ca. 15.000. Was wiederum einer Verminderung innerhalb des letzten Monats von ca. 10.000 “Problemen” entsprechen würde (im Juni waren es insgesamt 25.000) 🙂

Was sehr schön zu sehen ist das die Anzahl der Fehler von doppelten Wegen innerhalb der letzten Zeit sehr stark abgenommen hat. Derzeit verbleiben in Deutschland “nur” noch ca. 2.000 Probleme mit doppelten Wegen …

Auf welche Klassen verteilen sich insgesamt die “Fehler” des Routing Views Deutschland (Juli 2010)?

  • Gesamtanzahl 1m nicht verbunden: 2.700

Immer “mehr” Fehler in OSM DE?

Seit nunmehr vier Monaten setze ich mich mit der Untersuchung der OpenStreetMap (OSM) Daten auseinander. Dabei versuche ich mögliche Fehler im Kontext von Routing in Deutschland zu finden. Ein Ergebnis davon ist der Routing View, der derzeit von skobbler gesponsert wird. In diesem View werden momentan Fehler für Deutschland angezeigt, die durch nicht verbundene oder doppelte Straßen auftreten. Angefangen im März 2010 mit einer Fehleranzahl von mehr als 52.000 konnte die Gesamtanzahl auf momentan (Ende Mai) ca. 32.000 verringert werden.

http://www.flickr.com/photos/lemonpixel/246402687

http://www.flickr.com/ photos/lemonpixel/246402687/

Generell fällt dabei in der Vergangenheit auf, dass sich die Anzahl der Fehler immer nur dann vermehrt verringert, wenn das Thema in der deutschen OSM Maillingliste diskutiert oder angesprochen wird. Wurde nicht über das Thema geschrieben, verkleinerte sich die Anzahl der Fehler auch nicht groß. Zufall oder Wirklichkeit? Eine erste Gegenmaßnahme könnte sein: Mehr Werbung für die Tools machen, damit die Fehler in der OSM Datenbank behoben werden?