Tag: Germany

OpenData vom Bundesamt für Kartographie und Geodäsie vs. Crowdsourced OpenStreetMap in Deutschland – Ein Vergleich Offener Daten

Nach knapp 1.000 Tagen Abstinenz (endlich?) mal wieder ein Blog Post von mir. Aufgrund des inhaltlichen und räumlichen Bezugs diesmal auf deutsch. English version via Google translate?

Präambel – Im Herbst 2020 entstand beim FOSSGIS e.V. eine Open Data Arbeitsgruppe. Durch verschiedene gemeinsame Aktivitäten von der Arbeitsgruppe und dem Bundesamt für Kartographie und Geodäsie (BKG), wie z.B. einem Workshop, wurden Anfang Dezember 2020 zwei Datensätze von Standorten der Landespolizei und Gesundheitsämtern für die „Pflege und Erweiterung der OpenStreetMap-Datenbank“ freigegeben. Daneben existieren beim BKG noch weitere interessante „Open Data“ Geodaten und Webdienste, die aber aufgrund ihrer Lizenzbedingungen nicht vom OpenStreetMap (OSM) Projekt verwendet werden dürfen.

Ein „offizieller offener“ Datensatz von einer Bundesbehörde? Gut, wie sieht’s im Vergleich zu gemeinsam zusammengetragen Daten aus, z.B. OpenStreetMap? Lassen sich Unterschiede in der Qualität feststellen? Sind die Datensätze womöglich auf Augenhöhe oder existieren gravierende Unterschiede oder wovon könnten alle profitieren?

Um zumindest einen Teil der zuvor genannten Fragen beantworten zu können, liegt es auf der Hand eine klassische Qualitätsanalyse zwischen den zwei Datensätzen durchzuführen. Eine interessante Frage dabei: Welcher Datensatz ist die Referenzquelle? Ist der BKG Datensatz die Referenz oder inzwischen vielleicht der OSM Datensatz? In annähernd allen mir bekannten Qualitätsuntersuchungen wird der „offizielle“ Datensatz als Referenz angenommen, daher wird die folgende Analyse ebenfalls so durchgeführt.

Wie wurde methodisch vorgegangen? Die beiden hier untersuchten Datensätze vom BKG wurden über Github bezogen. Die OSM Elemente für den Vergleich wurden aus einem aktuellen Planetfile mit osmium für Deutschland extrahiert (vielen Dank an dieser Stelle an Jochen als Maintainer für dieses super schnelle Tool und die Unterstützer). Bei der eigentlichen Analyse der Qualität wurden folgende Merkmale untersucht: Vollständigkeit, Logische Konsistenz, Positionsgenauigkeit, Zeitliche Genauigkeit und Thematische Genauigkeit. Dabei kamen verschiedene JAVA Klassen zum Einsatz, die zum größten Teil bei mir auf GitHub gefunden werden können.

Wie sehen die einzelnen Ergebnisse des Vergleichs der Datensätze im Detail aus? Starten wir als erstes mit der Vollständigkeit von den beiden Datensätzen im Vergleich:

  • Anzahl Objekte Landespolizei vom BKG: 4,257
  • Anzahl Objekte amenity=police OSM: 3,871

Auf den ersten Blick existieren damit rund 10% mehr Standorte im Datensatz vom BKG als wie am 03.02.2022 in OSM eingetragen waren. Die Besonderheit liegt aber im verwendeten OSM-Element und -Tagging, was in der ersten Version dieses Blog Posts zu Abweichungen in den Ergebnissen bei der Vollständigkeit geführt hat.

Hier verfügt der „offizielle“ Datensatz vom BKG um rund 35% mehr Objekte als was in OSM auf die schnelle zu finden ist.

Die logische Konsistenz kann über verschiedene Wege geprüft werden. In meinem Beispiel hier wurde jeweils des BKG und der OSM Datensatz bzgl. des Vorhandensein der Attribute mit sich selbst untersucht. Bedeutet: Der Datensatz der Landespolizei vom BKG besitzt 11 Sachattribute und die Gesundheitsämter verfügen über 12 Sachattribute. Bei der Landespolizei sind bei den Objekten, bis auf Telefax (73%) und E_Mail (52%), die Attribute/Eigenschaften mindestens zu 97% angegeben. Bei den Gesundheitsämtern vom BKG sind, bis auf Telefax (80%) und E_Mail (90%), die Attribute mindestens zu 99% angegeben. Bei den OSM sieht dies anders aus. Vergleichbare Eigenschaften, also Tags (key-value Paare), sind bei den in OSM vorhandenen Standorten der Polizei mit name (86%), addr:street/housenumber/postcode/city (ca. 63%), phone (27%) und fax (8%) mit einem Wert vorhandenen. Bei den Gesundheitsämtern von OSM sieht es ähnlich aus: Hier sind name (100%), addr:street/housenumber/postcode/city (ca. 78%), phone (14%) und fax (7%) mit einem Wert befüllt.

Um die Genauigkeit der Lage (Positionsgenauigkeit) zu vergleichen, wurde jeweils mit einem Puffer im Umkreis von 500m um den Standort einer Landespolizei oder eines Gesundheitsamtes vom BKG nach vergleichbaren Objekten in OSM gesucht. Im genannten Umkreis der Landespolizei-Stellen vom BKG befindet sich bei 87% ein erstelltes Polizei-Element im OSM Datensatz. Bei den Gesundheitsämtern finden sich bei 44% ein Eintrag bei OSM.

Die Prüfung der thematischen Genauigkeit erfolgte nur über einen minimalistischen Ansatz, in dem die Namen der über die Positionsgenauigkeit verknüpften Objekte miteinander verglichen wurden. Hierbei zeigte sich, dass nur 25% (Gesundheitsämter) und 32% (Landespolizei) der Namen zwischen den BKG und OSM Datensätzen exakt übereinstimmen. Die Untersuchung dieses Qualitätsmerkmals könnte oder müsste umfangreicher angegangen werden.

Die Datensätze des BKG wurden im Jahr 2021 veröffentlicht. Bei OpenStreetMap wird für gewöhnlich der Zeitpunkt der letzten Änderung des Elementes für die Aktualität bzw. zeitliche Genauigkeit verwendet.

Zusatzinfo: Die Mitwirkenden beim OSM Projekt – In OpenStreetMap haben bei den Standorten der Polizei insgesamt mind. 1.428 verschiedene Mitglieder an den Daten mitgearbeitet. Bei den Gesundheitsämtern waren es mind. 120 Personen, die die Elemente in irgendeiner Form (Lage oder Sachinformationen) bearbeitet oder ergänzt haben.

Kurzzusammenfassung oder was bringt jetzt dieser „Vergleich“? Dieser Blog Post hat keinen Anspruch auf Richtig- und Vollständigkeit. Es wird dennoch gezeigt, dass neben der Quantität (siehe Vollständigkeit) insbesondere das Augenmerk anscheinend auf die Attribute bzw. enthaltenen Details zu den jeweiligen Einträgen bei OSM gelegt werden sollte. Welche Vorgehensweise hat sich bei OSM in der Vergangenheit etabliert? Zumindest in Deutschland sollten nicht nur meiner Meinung nach keine Datenimporte mehr stattfinden. Vielmehr würde es sich anbieten, und wie in manchen Städten oder Ländern bereits erfolgreich umgesetzt und gelebt, eine Art Datenabgleich angeboten werden, wonach Interessierte und Engagierte die einzelnen Einträge vergleichen können.

Solch freigebende Datensätze, wie die vom BKG, eignen sich hervorragend zur Kontrolle und/oder Erweiterung der gesammelten Daten des OpenStreetMap-Projektes. Um es hier auch erwähnt zu haben: Nicht nur gemeinsam zusammengetragene Daten, sondern auch offizielle Daten, können Fehler oder Abweichungen enthalten. Dadurch sollten nach Möglichkeit diese Daten oder Informationen nicht unreflektiert nach OSM übernommen werden.

PS: Dieser Blog Post hat keinen Anspruch einer Wissenschaftlichen Untersuchung, sondern ist einfach aus einer Laune heraus an einem Sonntagmorgen bei einem Espresso entstanden. Hoffe es waren dennoch ein paar interessante Einblicke für Euch mit dabei?

What Impact has the OSM License Change in Germany on the Street Network Length? – 1st Attempt –

The OpenStreetMap project will possibly finalize its license change on April 1st 2012. There are certain concerns in the community about possible data losses and to keep them as little as possible, several remapping activities have been started. A really nice overview of “Remapping principles” and “Tools to help you” can be found here.

Frederik’s OSMInspector (OSMI) and Simon’s CLEANMAP are two very handy remapping tools. Both display data that will likely be removed after April 1st due to the fact that this data was collected by contributors that did not accept the license change. In Germany you will find several areas that are affected by these changes and might even leave some new blank spots in the map. But what impact do these changes have on the total length in kilometers per street category in Germany?

You can find several files regarding the OSMI license change view at a Geofabrik server here. Based on the “ways” shape file that you can find there it is possible to calculate the total length of the ways, which will likely be removed with the license change. However, sadly the “ways” shape file does not include any “highway” attribute, but luckily it includes the OSM IDs. This means that to be able to do a Germany street network analysis you will have to download the Geofabrik Germany OSM *.pbf file. By applying a short script you can get all OSM way IDs in Germany with their highway=* key/value pair. Combining these with the “ways” shapefile allows us to calculate the total lengths of each highway type for “Germany” (based on the Geofabrik extract!).

The following image shows the results of a first attempt to visualize the values per street category. Overall this means that based on the current (January 15th 2012) license agreement/disagreement situation about 5.4% (94000 km) of the current street network in Germany will be removed after the license change in April. The relative difference for each highway type lies between 3-8%. Last week (Jan. 7th, 2012) the total amount in Germany was 5.9% and 103000 km.

The OSMI License Change view contains not only the data that will potentially be removed in the future but also some information on two additional feature-types: Features, which have been modified and features which have been modified in some minor way by a contributor that declines the license change. In the first case we have a total street network length of about 58000 km that is affected and in the second case about 17000 km. Remember, these numbers only reflect the situation in Germany! You can find more information about the different feature types here: “Understanding the Colour Scheme“.

Notice: This was a short hack done last night, but I think those numbers look realistic. Can anyone confirm this for Germany? I am very curious how and if these numbers will decrease in the next few weeks. What do you guys think?

thx @ maɪˈæmɪ Dennis

OpenStreetMap in Germany (2007-2011)

Due to some requests by some German OpenStreetMap contributors, here a German blogpost about the results of the article: “The Street Network Evolution of Crowdsourced Maps: OpenStreetMap in Germany 2007–2011.” By Pascal Neis, Dennis Zielstra & Alexander Zipf. 2012. Future Internet 4, no. 1: 1-21. (doi:10.3390/fi4010001) Link: http://www.mdpi.com/1999-5903/4/1/1/

Bemerkung: Im Folgenden sind ausgewählte Ergebnisse und Diagramme aus dem englischen Artikel dargestellt/zusammengefasst. Bei weiterem Interesse bitte das Original Journal Paper lesen. Es beinhaltet bei weitem mehr Informationen und Abbildungen!

Das OpenStreetMap (OSM) Projekt ist das bekannteste Projekt im Bereich Volunteered Geographic Information (VGI). Weltweit beteiligen sich mehrere hundert tausend Mitglieder um Informationen für eine „freie“ Geodatenbank zu sammeln. Der Zuwachs der Daten ist weltweit recht heterogen, Deutschland zählt aber global zu eine der aktivsten Länder und die Anzahl der Projektbeteiligten steigt von Jahr zu Jahr. Aktuell (Juni 2011) haben insgesamt mehr als 40000 unterschiedliche Mitglieder zum Deutschland Datensatz beigetragen. Wie in der folgenden Abbildung zu sehen, haben unterschiedliche Mengen von Mitgliedern, die drei OSM Objektarten (Node, Way & Relation) in Deutschland erzeugt. Eine weitere wichtige Information ist in der Abbildung ebenfalls zu sehen: 98% der Punkte wurden von ca. 8500 Mitgliedern, 98% der Linien von ca. 7500 und 98% der Relations auf ca. 2600 Mitglieder generiert (wenn man den letzten Eigentümer als Ersteller bewertet).

(c) MDPI

(c) MDPI

In folgender Abbildung ist die Entwicklung des Gesamtstraßennetzes für Deutschland für die vergangenen vier Jahre (2007-2011) zu sehen. Die vielen unterschiedlichen Straßenkategorien wurden aus Übersichtsgründen und für bessere Untersuchungs- und Vergleichsmethoden in vier Gruppen zusammengefasst (Autobahn/Schnellstraßen, Kreisstraße/Gemeidestraße, Straßen an/in Wohngebieten und sonstige wie Service oder Feld-/Waldwege).

(c) MDPI

(c) MDPI

Verfolgt man den Wachstum der unterschiedlichen Kategorien, ist zu erkennen, dass ab einem bestimmten Zeitpunkt manche Kategorien nicht mehr weiter zunehmen. Daraus lässt sich ableiten, ab wann eine Kategorie annährend „komplett“ erfasst gewesen sein dürfte oder wo noch neue Straßen hinzukommen. Bei diesem ersten Vergleich ist aber folgendes zu beachten: Der Datensatz von TomTom eignet sich nur für einen Vergleich des Wegenetzes für die Autonavigation (also drei der vier Kategorien). Die Kategorie „Sonstige Wege“kann nur bedingt im Vergleich berücksichtigt werden. In der vierten Kategorie hat OSM ein bereits viel höheres Wegenetz als der kommerzielle Anbieter. Basierend auf den eben erwähnten Annahmen und dem Vergleich mit den TomTom Kategoriestraßenlängen kommen wir zu folgenden Ergebnissen:

  1. Autobahnen/Schnellstraßen waren bereits Mitte 2008 komplett erfasst
  2. Mitte 2009 waren Kreisstraßen/Gemeindestraßen in Deutschland erfasst
  3. Straßen in/an Wohngebieten sind noch nicht vollständig erfasst
  4. Ende 2009 hatte OSM bereits mehr „Sonstige Wege“ als der kommerzielle Datensatz von TomTom
  5. In der Gesamtsumme des Wegenetzes hat OSM seit Mitte 2010 TomTom übertroffen. Wobei hier sicherlich die vielen Feld- und Waldwege für OSM ein Vorteil sind.
  6. Aktuell (Juni 2011) wird in OSM Deutschland größtenteils nur noch vereinzelt am Wegennetz an und in Wohngebieten und vermehrt am sonstigen Wegenetz gearbeitet (Wald-, Wiesen- und Feldwegen).

Die Entwicklung der einzelnen Straßenkategorien im Vergleich zum TomTom Datensatz ist in der folgenden Abbildung zu sehen.

(c) MDPI

(c) MDPI

Damit hat sich in Deutschland aktuell (Juni 2011) das OSM Straßennetz für die Autonavigation bis auf 9% an vergleichbare Datensätze herangearbeitet und besitzt im Bereich des Gesamtwegenetzes sogar über 27% mehr Informationen. Durch den aktuellen Zuwachs in den fehlenden Straßenkategorien dürfte OSM die noch offene Differenz im Straßennetz bis Mitte/Ende 2012 ausgleichen.

Neben dem Wegenetz wurden auch die Gesamtzahlen der Abbiegevorschriften pro Straßenkategorie miteinander verglichen.

(c) MDPI

(c) MDPI

Wie im oberen Bild zu sehen ist, ist die Differenz zwischen TomTom und OSM nicht gering. Damit sind aktuell mehr als fünfmal so viele Abbiegevorschriften bei TomTom für Deutschland verfügbar im Vergleich zu OSM. Die Anzahl von Abbiegevorschriften steigt zwar stetig bei OSM, trotzdem dürfte es vermutlich nach jetzigem Stand und Zuwachs noch mehrere Jahre dauern bis OSM hier aufschließen kann.

Der komplette (englische) Artikel mit weiteren Untersuchungen und Abbildungen ist hier kostenfrei herunterladbar: http://www.mdpi.com/1999-5903/4/1/1/

thx @ maɪˈæmɪ Dennis

Using OpenHeatMap

Nearly three months ago I saw a tweet by mapperz (here). The tweet introduced http://www.openheatmap.com (OHM) : “Turn your spreadsheet into a map” . A very interesting tool. Unfortunately I completely forgot about it in the past weeks until last night. I was looking for an easy method to present some data on a map.

Using OHM is really simple. Upload your CSV file, which suits a certain format, and your data is more or less presented on an OpenStreetMap basemap 🙂

In my case, I used the TMC data of Germany for one week (since 2010-09-12) to present it on a map. For each intersection I counted the number of traffic messages for that specific week. The red areas in the map represent those intersections with a high concentration of messages. My result-OHM-map can be found here: http://www.openheatmap.com/view.html?map=OverestimatedOdessasShevat

The visualization of the CSV file looks pretty cool, doesn’t it? Especially the Berlin area shows a very nice representation of TMC messages.

Generally speaking, Pete’s Projekt http://www.openheatmap.com is working very well. A few adjustments still need to be made though. It would be nice to include a zoom function that works with the mouse wheel. Probably this was one of the first problems you encountered too?! But still: Keep up the good work!

thx @ georg for supporting the TMC Database dump
and again thx @ dennis !

#OSM Routing View 2010-08

Anbei die Statistiken für den Monat August 2010 vom OSM Inspector Routing View Germany. Den ersten Platz im beseitigen von Fehlern zumindest in der 1m-Fehler-Klasse teilen sich diesen Monat Hessen & Bayern 🙂 Aber auch in Rheinland-Pfalz hat sich einiges getan! Nur bei Baden-Württemberg und Nordrhein-Westfalen ist eher eine zunehmende Anzahl von Fehlern zu sehen 🙁

Die Gesamtanzahl der Fehler (nichtverbundene & doppelte Straßen) liegt im jetzigen Monat für Deutschland bei ca. 12.500. Was wiederum einer Verminderung innerhalb des letzten Monats von ca. 2.500 “Problemen” entspricht. Letzten Monat wurden noch 4mal (!!!) so viele Fehler bereinigt. Sommerloch weil Reisezeit? 😉

Im Monat August verteilen sich die Probleme im Routing View Germany auf folgende Klassen:

  • Gesamtanzahl 1m nicht verbunden: ca. 2.100 (Juli 2.700)
  • Gesamtanzahl 2m nicht verbunden: ca. 1.300 (Juli 1.500)
  • Gesamtanzahl 5m nicht verbunden: ca. 7.600 (Juli 8.600)
  • Gesamtanzahl doppelte Ways: ca. 1.400 (Juli 2.000)

“Incomplete” Places in DE?

Bei der letzten Analyse für die Suche nach „unmapped“ Places, habe ich gleichzeitig noch nach „incomplete“ Places in OSM Deutschland suchen lassen. Bei dieser Suche wurden lediglich Ortsangaben mit dem Placetype „village“ berücksichtigt. Ein weiteres Suchkriterium war dabei, dass mindestens eine und nicht mehr als drei Straßen von der Kategorie unter einer Kreisstraße um die Ortsangabe herum vorhanden sind.

Folgende Gesamtzahlen stammen noch vom letzten Blog Post. Insgesamt gibt es in Deutschland (Stand Ende Juli 2010) ca. 71.885 Ortsangaben. Dabei ist die Aufteilung wie folgt: ca. 579 Großstädte, ca. 2.386 Städte, ca. 8.092 Stadtteile, ca. 36.893 Dörfer und 23.935 Weiler. Bei dieser Untersuchung kam ich auf eine Anzahl von ca. 830 Dörfern (ca. 2.2%) die scheinbar noch nicht vollständig sein könnten. Bei der Untersuchung bezüglich der „unmapped“ Places waren es ca. 6.010 Dörfer (16,3%).

Wie bei der letzten Untersuchung befinden sich die ermittelten Dörfer wieder eher in sehr ländlichen Gebieten. Das Ergebnis ist wieder hier als GPX-File herunterladbar. Oder hier als Overlay (http://resultmaps.neis-one.org/) auf einer OSM-Karte zu betrachten. In meiner Gegend passen die Ergebnisse dieser Untersuchung ganz gut, wie sieht es bei euch aus? Verbesserungsvorschläge?

“Unmapped” Places in DE?

Gerade vergangene Woche wurde in der Presse wieder über OpenStreetMap und dessen Datenqualität (Vollständigkeit) gesprochen. Beispielsweise gab es hier (Golem) einen Artikel: “OpenStreetMap ist reif für den geschäftlichen Einsatz”. Ich finde das diese Aussage aber differenziert betrachten werden muss, für was genau die Daten verwendet werden sollen. Für Kartendarstellungen, Geomarketing und/oder Autonavigation? Für welches Land? Wie auch immer, Qualitätsuntersuchungen gibt es schon länger und sie zeigen auch, das sich die Qualität (Vollständigkeit) von Region zu Region unterscheiden kann.

Letzte Woche bin ich eher durch Zufall auf folgende OSM-Wiki-Seite gestoßen: “Quality Assurance”. Sie zeigt eine gute Übersicht von verschiedenen für OSM wichtigen Qualitäts-Tools. Unter anderem fand ich dort auch von Gary68 das Tool “Unmappedplaces”. Die Idee hinter diesem Tool fand ich interessant: Es versucht für ein OSM-File alle “potenziell unkartografierte Places” zu finden. Die Ergebnisse in meiner Region waren allerdings nicht so, das die Places die ich ebenfalls kennzeichnen würde, auch gefunden wurden. Deswegen habe ich versucht das Ganze “neu” zu machen. Für Deutschland kam dabei mein Tool auf folgende Ergebnisse.

Insgesamt gibt es in Deutschland ca. 71.885 Ortsangaben. Dabei ist die Aufteilung wie folgt: ca. 579 Großstädte, ca. 2386 Städte, ca. 8092 Stadtteile, ca. 36893 Dörfer und 23935 Weiler. Die ersten drei Placetypes wurden bei meiner aktuellen Untersuchung außen vorgelassen, da ich denke, dass diese in Deutschland zumindest ansatzweise bereits in OSM vorhanden sein dürften. Mein Tool hat bei der Untersuchung für Deutschland ca. 14.270 Orte gefunden bei denen lediglich eine Ortsangabe und eine Kreisstraße oder Straße höherer Klasse in der Umgebung um die Ortsangabe vorhanden ist. Bei einer Summe von ca. 60.828 möglichen Ortsangaben wäre dies ein Anteil von ca. 23% !

Im Bild ist, wie oben bereits angedeutet, gut zu sehen das es außerhalb der Großstädte oder z.B. des Ruhrpottes noch einige Ortschaften gibt die anscheinend noch nicht in OSM erfasst sind. Interessant könnten eventuell noch weitere Vergleiche sein: Wie viele Ortsangaben hat ein Bundesland insgesamt und wie viele davon sind noch nicht “kartografiert“?

Das Ergebnis kann als GPX/TXT-Datei hier heruntergeladen werden (bitte die Dateiendung von *.txt in *.gpx ändern!). Weiterhin kann hier das Ergebnis als GPX-Overlay über einer OSM Map betrachtet werden.

Wo erfolgen die meisten Edits in OSM?

Angeregt durch den vorletzten Post über die „zunehmende“ Anzahl der Fehler in OpenStreetMap DE stellte sich mir die Frage: In welchem Bundesland wird derzeit am meisten an der Map gearbeitet? Aus den daily-Planet-Changefiles für den Zeitraum vom 3.6. bis zum 10.06.2010 (1 Woche) habe ich mal die mittlere Anzahl der Node Edits pro Tag für jedes Bundesland in Deutschland ausgewertet (Edits an Ways sind in diesen Diagrammen (noch) nicht enthalten).

Im Diagramm fallen die drei „großen“ Bundesländer auf. Nordrhein-Westfahlen ist ebenfalls wieder im vorderen Feld der Statistik dabei. Diesmal aber im positiven Sinne 😉 . Bei der Statistik zum Routing View Analyse war es genau andersherum, dort war es das Bundsland mit den meisten Fehlern im Landesvergleich, (vgl. Statistik). Also somit ist NRW das wohl derzeit aktivste Bundesland in OSM DE, aber auch das mit den meisten Fehlern?!

In den Mailinglisten oder auch in den Foren liest man immer wieder eine etwas unterschiedliche Zahle wie groß denn die Beteiligung der deutschen Mapper an der OSM Karte ist. Im folgenden Diagramm sind die Anzahlen der Mapper pro Bundesland für DE für den oben angegeben Zeitraum, die dort einen oder mehrere Edits ausgeführt haben, zu sehen.

Werden die weltweiten OSM Mapper gezählt, so kommt man beim oben genannten Zeitraum von einer Woche auf eine tägliche Durchschnittszahl von ca. 1.710 die jeweils eine oder mehrere Edits an der Map vollbringen. Bei einem Mittelwert in DE von ca. 580 “Mappern” (Usern die in Deutschland an der Map gearbeitet haben) wären dies ca. 34% ! Dies würde bedeuten, dass derzeit ca. 1/3 der weltweiten OSM-Mapper in Deutschland an der Karte arbeiten. Gut für Deutschland, „schlecht“ für die restliche weltweite OSM Karte?

Eine Xls-Tabelle mit den Node Changes pro Tag für Deutschland kann hier heruntergeladen werden.

Neue Stats zum OSM DE Routing View!

Habe heute wieder neue Statistiken zum OSM Routing View erstellen lassen. Schön zu sehen das Insgesamt die Fehleranzahl bei den nicht verbundenen Straßen (1m) zurück geht.

Etwas bedenklich ist allerdings die Entwicklung in Hessen. Dort hat sich die Fehleranzahl von ca. 400 auf quasi über 800 verdoppelt. Mit dem Saarland ist auch das erste Bundesland für den dargestellten Fehlertyp auf 0, Glückwunsch 🙂 ! Spitzenreiter im beseitigen der Fehler sind für den letzten Zeitraum die Länder NRW & RLP. Beide konnten um die 400 Fehler beheben …

Die Analyse läuft jetzt etwas weniger als vier Monate und die Gesamtanzahl der Fehler (nicht verbundene Straßen & doppelte Wege) konnte von über 50.000 auf ca. die Hälfte (25.900) verringert werden!

Immer “mehr” Fehler in OSM DE?

Seit nunmehr vier Monaten setze ich mich mit der Untersuchung der OpenStreetMap (OSM) Daten auseinander. Dabei versuche ich mögliche Fehler im Kontext von Routing in Deutschland zu finden. Ein Ergebnis davon ist der Routing View, der derzeit von skobbler gesponsert wird. In diesem View werden momentan Fehler für Deutschland angezeigt, die durch nicht verbundene oder doppelte Straßen auftreten. Angefangen im März 2010 mit einer Fehleranzahl von mehr als 52.000 konnte die Gesamtanzahl auf momentan (Ende Mai) ca. 32.000 verringert werden.

http://www.flickr.com/photos/lemonpixel/246402687

http://www.flickr.com/ photos/lemonpixel/246402687/

Generell fällt dabei in der Vergangenheit auf, dass sich die Anzahl der Fehler immer nur dann vermehrt verringert, wenn das Thema in der deutschen OSM Maillingliste diskutiert oder angesprochen wird. Wurde nicht über das Thema geschrieben, verkleinerte sich die Anzahl der Fehler auch nicht groß. Zufall oder Wirklichkeit? Eine erste Gegenmaßnahme könnte sein: Mehr Werbung für die Tools machen, damit die Fehler in der OSM Datenbank behoben werden?

Eine zweiter interessanter Punkt ist: Warum werden die Fehler vereinzelt an manchen Tagen nicht weniger sondern manchmal im Gegenteil massiv mehr? Wie kann das sein? Ein gutes Beispiel war hierfür das Wochenende nach einem Feiertag, wo von einem auf den anderen Tag mehr als 2.000 neue Fehler hinzukamen, bei lediglich ca. 12.000 neuen Wegen. Dies würde bedeuten, dass durchschnittlich damals jeder sechster (!!!) neuer Weg einen Fehler beinhaltet oder verursacht hat. Ziemlich viel 🙁

http://farm3.static.flickr.com/2535/4197644976_8092c89fcf.jpg

http://www.flickr.com/photos/45419239@N02/4197644976/in/set-72157623030327270/

Hierbei stellen sich mir unterschiedliche Fragen: Sind die Fehler durch „neue“ Mapper verursacht worden? Liegt es an den OSM-Editoren? Müssten vielleicht bessere oder überhaupt irgendwelche Validierungstools direkt beim Einpflegen der Daten auf mögliche Probleme hinweisen? Manchmal habe ich das Gefühl, dass sich viele Gedanken darüber machen wie sie alles mögliche mappen könnten. Doch dabei kümmern sich anscheinend manche nicht besonders um die Qualität der Daten und vernachlässigen diese. Allgemein finde ich es gut wenn in OSM eine Vielfalt von Daten vorhanden ist oder hinzugefügt wird, aber dabei sollte nicht die Qualität der Daten außer Acht gelassen werden! Oder doch lieber: Quantität statt Qualität?! Manchmal kommt es mir so vor …