• Keine Ergebnisse gefunden

Statistik Austria, Pendelzielstatistik 2015, Konsumerhebung 2014/15 direkt verknüpft mit Pendelzielstatistik;

Im Dokument „Österreich Unterwegs“ (Seite 59-65)

zum Datensatz der Konsumerhebung über einen durch das ZMR anonymisierten 28-stelligen Personenschlüssel, das sogenannte „bereichsspezifische Personenkennzeichen“, kurz „bPK“.

Da der Haushaltsdatensatz der Konsumerhebung mit dem Haushaltsdatensatz von „Österreich unterwegs“

verknüpft wurde, musste auch die Pendelzielstatistik auf Haushaltsebene herangezogen werden. Es wurden die maximale Pendeldistanz (Wegstrecke) und die Summe der Distanzen eines Haushalts, die maximale Wegzeit und die Summe der Wegzeiten sowie die Anzahl der Pendlerinnen und Pendler pro Haushalt der Konsumerhebung mittels Record Linkage (siehe Abschnitt 4.1) zugefügt. Aus diesen Werten lassen sich eine durchschnittliche Wegzeit und eine durchschnittliche Wegstrecke pro Haushalt errechnen.

Danach wurden über das Statistical Matching der Konsumerhebung mit „Österreich unterwegs“ auch die genannten Merkmale aus der Pendelzielstatistik mit „Österreich unterwegs“ verbunden.

Die anschließende Datenvalidierung brachte jedoch keine zufriedenstellenden Ergebnisse um Rückschlusse auf die österreichische Grundgesamtheit ziehen zu können. Die folgende Abbildung 19 stellt folgende Daten einander gegenüber:

 Pendeldistanz laut Pendelzielstatistik (Vollerhebung, alle Haushalte Österreichs)

 Pendeldistanz laut Konsumerhebung (direkte Verknüpfung, Stichprobe, 7.162 Haushalte)

 Pendeldistanz laut „Österreich unterwegs“ (Statistical Matching, Stichprobe, 17.070 Haushalte)

Abbildung 19: Vergleich der durchschnittlichen Pendeldistanz der Haushalte nach Bundesländern.

Pendelzielstatistik eher geringe Distanzen aus, wird laut den in „Österreich unterwegs“ eingefügten Pendeldistanzdaten dagegen stark überschätzt (Abbildung 19). Auch ein Vergleich der Pendeldaten für die Haushalte der Konsumerhebung mit den Daten der Pendelzielstatistik für alle Haushalte Österreichs zeigt Datenabweichungen. Die Gründe hierfür können u.a. in einer unterschiedlichen Haushaltszusammensetzung zwischen Konsumerhebung und der Pendelzielstatistik liegen, Stichprobenziehung der Konsumerhebung und Meldeabweichungen können sich ebenfalls auswirken.

Problematisch scheint vor allem, dass eine Regression der durchschnittlichen Pendeldistanz mit den Verknüpfungsvariablen zwar in der Konsumerhebung einen signifikanten Modellzusammenhang zeigt, aber nicht mehr in „Österreich unterwegs“.

Mehrere Ursachen können dahingehend wirken, dass die Informationen zum Pendeln nach dem Matching mit der Konsumerhebung nicht zufriedenstellend im Datensatz von „Österreich unterwegs“ abgebildet sind.

Folgende Effekte können – wenn auch nicht ausschließlich - maßgeblich dazu beitragen:

 Die Verknüpfungsvariablen von „Österreich unterwegs“ und der Konsumerhebung wurden weitgehend abgeglichen. Trotzdem basieren die Variablen teilweise auf unterschiedlichen Definitionen, die Auswirkungen auf den Matchingprozess haben können. Die Definition der Variable

„Kinder im Haushalt“ weicht etwa bei Konsumerhebung und „Österreich unterwegs“ voneinander ab.

 Die bereits in Abschnitt 4.4.3 aufgezeigten Stichprobeneffekte können Abweichungen zwischen der Grundgesamtheit und den verknüpften Werten in „Österreich unterwegs“ ergeben. „Österreich unterwegs“ weist beispielsweise eine höhere Schulbildung der Haushalte aus als die Konsumerhebung. Da die Schulbildung hoch signifikant mit dem Einkommen verknüpft ist (eine höhere Schulbildung führt tendenziell zu einem höheren Einkommen, siehe Tabelle 6), wurde diese Variable trotz der Unterschiede in den Ausprägungen als Verknüpfungsvariable verwendet.

 Abweichungen in der Haushaltszusammensetzung zwischen der Melderealität laut ZMR in der Pendelzielstatistik und der Erhebungsrealität laut Konsumerhebung bzw. „Österreich unterwegs“

können ebenfalls zu unterschiedlichen Ergebnissen führen.

 Während die Pendelzielstatistik eine Vollerhebung darstellt, werden die Stichprobendaten aus der Konsumerhebung und „Österreich unterwegs“ jeweils mit unterschiedlichen Gewichten hochgerechnet. Je nach den ausgewählten Gewichtungsvariablen ergeben sich unterschiedliche Effekte auf die hochgerechneten Werte.

 Die Vollerhebung der Pendelzielstatistik bezieht sich auf einen Stichtag (31.10.2015), die Stichprobe der Konsumerhebung wurde im Zeitraum Ende Oktober 2014 – Anfang November 2015 erfragt. „Österreich unterwegs“ wurde von Oktober 2013 bis Oktober 2014 erhoben.

Aufgrund dieser Ergebnisse ist von einer Verwendung der statistisch verknüpften Daten der Pendelzielstatistik in „Österreich unterwegs“ abzuraten. Hier wäre zukünftig eine Verschlüsselung der Daten von „Österreich unterwegs“ über das ZMR mit Personenschlüsseln, das sogenannte

„bereichsspezifische Personenkennzeichen“, kurz „bPK“ Forschungsbedarf zu prüfen. Damit könnte eine bessere Verknüpfung mit weiteren verschlüsselten Datensätzen erreicht werden. Dies würde jedoch den Umfang der aktuellen Machbarkeitsstudie überschreiten.

Direkte Ergebnisse aus der Pendelzielstatistik können jedoch in AP5 zur Datenvalidierung der Pendelwerte von „Österreich unterwegs“ verwendet werden. Allerdings ist auch dabei auf folgende Unterschiede zwischen den beiden Erhebungen hinzuweisen:

 Die in „Österreich unterwegs“ erhobenen Mobilitätswege für andere Zwecke als zur Arbeits- oder Ausbildungsstätte werden in der Pendelzielstatistik nicht erfasst.

 Für Pendlerinnen und Pendler ins Ausland stehen in der Pendelzielstatistik keine Kilometer für den Arbeitsweg zur Verfügung. Für Schülerpendler/-innen und Studierende gibt es generell keine Informationen über besuchte Ausbildungseinrichtungen im Ausland.

 Die Daten der Pendelzielstatistik beziehen sich auf den Stichtag 31.10.2015, „Österreich unterwegs“ hat dagegen den Erhebungszeitraum Oktober 2013 bis Oktober 2014 mit jeweils zwei Erhebungstagen.

 Wie bereits erwähnt, bildet die Pendelzielstatistik vorrangig die Melderealität ab, die von der tatsächlichen Lebensrealität einzelner Haushalte auch abweichen kann. Beispielsweise kann der Hauptwohnsitz laut ZMR in Vorarlberg liegen, die Arbeitsstätte in Wien. Laut Melderealität würde daher die Pendeldistanz Vorarlberg – Wien betragen, es könnte jedoch eine Übernachtungsmöglichkeit in Wien bestehen, die nicht gemeldet wurde und entsprechende Auswirkungen auf die faktische Pendeldistanz hätte.

 Allgemein fehlen Informationen zu den Pendelhäufigkeiten (z.B. Tagespendler oder Wochenpendler, oder an wie vielen Arbeitstagen gependelt wird), hier können nur Annahmen aufgrund der Distanz und des Beschäftigungsausmaßes getroffen werden.

 Die Art des Verkehrsmittels steht in der Pendelzielstatistik nicht zur Verfügung. Die Berechnung der Entfernung zwischen Wohn- und Arbeitsort bzw. Ort der Ausbildungseinrichtung der Erwerbspendlerinnen und -pendler und Schülerpendlerinnen und -pendler bzw. Studierende erfolgt ausschließlich für den motorisierten Individualverkehr auf den Straßen Österreichs und dem angrenzenden Ausland. Die Berechnungen wurden also von Gebäude (Wohnung) zu Gebäude (Arbeit, Ausbildungsstätte) nach optimierter Wegzeit basierend auf dem Straßennetzwerk durchgeführt. Für die Pendelwege könnten jedoch auch andere Verkehrsmittel wie Bahn oder Bus genutzt werden, die entsprechende abweichende Wegestrecken und Wegezeiten haben könnten.

4.8. Fazit

Der vorliegende Abschnitt 4 beinhaltet die Datenverknüpfung von Haushaltseinkommen und Verbrauchsausgaben aus der Konsumerhebung 2014/15 mit dem Mobilitätsdatensatz von „Österreich unterwegs“.

Wie bereits angemerkt, war nach genauer Betrachtung der Verknüpfungsvariablen davon auszugehen, dass die Abweichungen der Erhebung „Österreich unterwegs“ von den repräsentativen Ergebnissen der Konsumerhebung - neben den angeführten unterschiedlichen Variablendefinitionen - im Wesentlichen auf verschiedene Stichprobeneffekte zurückzuführen sind, die sich u.a. auch in der thematischen Natur der Mobilitätserhebung begründen. Die für „Österreich unterwegs“ gewählte Gewichtung kann diese Effekte nur zum Teil ausgleichen.

Es wurde erwartet, dass die Verteilung bspw. des Einkommens im Datensatz der Konsumerhebung von der Verteilung in „Österreich unterwegs“ abweicht, auch wenn auf Haushaltsebene die Einkommen genau imputiert wurden. D.h. beispielsweise, dass aufgrund der älteren Altersstruktur in „Österreich unterwegs“ – und da Alter und Einkommen positiv korrelieren – das durchschnittliche (statistisch verknüpfte) Einkommen im Datensatz von „Österreich unterwegs“ das durchschnittliche Einkommen im Datensatz der Konsumerhebung übersteigen wird. Ein umgekehrter Effekt wäre etwa beim Besitz von Zeitkarten zu erwarten.

Einkommen und Verbrauchsausgaben in Österreich bilden den Annahmen von Abschnitt 4.4 folgend die Grundgesamtheit der Haushalte in Österreich zwar nicht korrekt ab, zeigen jedoch voraussichtlich reliable Werte für die spezielle Stichprobe der Mobilitätserhebung „Österreich unterwegs“.

Eine Durchführung des Statistical Matchings wurde daher weiterhin empfohlen, da die statistisch imputierten Variablen in „Österreich unterwegs“ für die Betrachtung von Zusammenhängen auf Haushaltsebene statistisch valide Werte ergeben sollten.

Dieser Empfehlung folgen die Ergebnisse der Datenevaluierung für die Variablen zum Haushaltseinkommen sowie zu den Verbrauchsausgaben.

Die ermittelten Unterschiede in der Höhe der durchschnittlichen Ausprägungen zwischen Konsumerhebung und „Österreich unterwegs“ erscheinen für eine erste Einschätzung von Mobilitätsfaktoren in Abhängigkeit von Einkommen und Verbrauchsausgaben als vernachlässigbar. Die Verteilung der Werte in „Österreich unterwegs“ verhält sich erwartungsgemäß und wie die vorgenommenen Regressionen zeigt, bilden die Verknüpfungsvariablen aus „Österreich unterwegs“ die verknüpften Variablen Haushaltseinkommen, Verbrauchsausgaben insgesamt sowie Verbrauchsausgaben für Verkehr zufriedenstellend ab.

Zudem ist ein hochsignifikanter Zusammenhang zwischen der Variable zur wirtschaftlichen Situation der Haushalte und den verknüpften Variablen gegeben, der ebenfalls auf valide Ergebnisse durch das Statistical Matching hinweist. Bei der Verwendung der verknüpften Variablen in den Use cases sollten die Auswirkungen der beschriebenen Stichprobeneffekte jedoch Bedacht finden.

Für die Pendelzielstatistik konnte das geplante Record Linkage mit der Konsumerhebung zwar durchgeführt werden, die Evaluation der Ergebnisse ergab jedoch, dass von einer Verwendung der statistisch verknüpften Daten aus der Pendelzielstatistik in „Österreich unterwegs“ abzuraten ist. Ergebnisse aus der Pendelzielstatistik24 können jedoch zur Datenvalidierung der Pendelwerte von „Österreich unterwegs“

verwendet werden (vgl. Abschnitt 5). Dabei ist auf die bereits angeführten Unterschiede zwischen den beiden Erhebungen hinzuweisen.

Die folgende Abbildung 20 zeigt das Ergebnis des Statistical Matchings im Rahmen der vorliegenden Machbarkeitsstudie, welches im Vergleich zur Potentialanalyse aus Abschnitt 4.1 (Abbildung 3) die Pendelzielstatistik nun für den Ergebnisabgleich in Abschnitt 5 empfiehlt. Zudem wird weiterhin angeregt, die Ergebnisse aus Mikrozensus Umwelt und Energie für den Ergebnisabgleich zu verwenden.

Abbildung 20: Ergebnis Statistical Matching, Einbindung weiterer Datenquellen.

Q: Statistik Austria.

24 Hier wird auf Ergebnisse direkt aus der Pendelzielstatistik und nicht auf die statistisch verknüpften Werte im Rahmen dieser Studie abgezielt.

5. Validierung der Verschneidung

Die in diesem Abschnitt vorgenommenen Vergleiche dienen zur Darstellung von (quantitativen) Unterschieden, die zwischen „Österreich Unterwegs“ und anderen – im Rahmen dieser Studie betrachteten – Datensätzen, bestehen. Dies lässt zum einen Rückschlüsse darauf zu, ob und wie stark einzelne Merkmale oder auch MerkmalsträgerInnen in den einzelnen Datensätzen über- oder untererfasst sind. Zum anderen liefern die Ergebnisse Anhaltspunkte dazu, wie ähnlich die einzelnen Datensätze sind, bzw. ob Nichtübereinstimmungen zwischen vergleichbaren Werten inhaltlich/methodisch begründbar sind oder nicht.

In letzter Konsequenz lassen sich so auch Aussagen zur Validität der Datensätze ableiten.

Als generelle Herangehensweise werden dabei stets sowohl die (1) absoluten Abweichungen zwischen ÖU und anderen Datensätzen betrachtet, wie auch Unterschiede in den (2) Verteilungen, d.h. die relativen Abweichungen zueinander über verschiedenen Gliederungsmerkmale, wie z.B. Bundesländer, oder Altersgruppen. Während Abweichungen in der Kategorie 1 z.B. auf methodische oder definitorische Unterschiede zurückzuführen sind, können fehlende Übereinstimmung von Trends bzw. Verteilungen (2) nur eingeschränkt bzw. gar nicht erklärt werden. In solchen Fällen ist also eine – an und für sich zu erwartende – Übereinstimmung zwischen zwei Datensätzen nicht gegeben oder es gibt bislang unbekannte Gründe für die Abweichungen.

Wie in Abschnitt 4.1 dargestellt, gibt es in Österreich eine Reihe von Datensätzen die (in unterschiedlichem Ausmaß) grundsätzliche Vergleiche mit „Österreich Unterwegs“ zulassen. Der eigentliche Zweck der in diesem Berichtteil dokumentierten Arbeiten liegt darin, die einzelnen Datensätze vergleichbar zu machen. Dies bedeutet konkret, dass durch Re-kodierung, Re-Klassifizierung von Merkmalen, sowie durch gezielte Aggregation und Disaggregation von MerkmalsträgerInnen versucht wurde, gut vergleichbare Randsummen zu berechnen und einander gegenüber zu stellen.

Für eine Übersicht der in diesem Abschnitt mit ÖU verglichenen Datenbestände soll auf Abschnitt 3.2 verwiesen werden: im Einzelnen beziehen sich die Vergleiche auf die Pendelzielstatistik (PZS), den Mikrozensus Energie (MZ Energie) und den Mikrozensus Umwelt (MZ Umwelt). Die Analysen und Auswertungen die sich auf den mittels ‚statistical matching‘ zwischen ÖU und Konsumerhebung gewonnenen Datensatz (AP4) beziehen finden sich in Abschnitt 4.5.

5.1. ÖU und Pendelzielstatistik

5.1.1. Vorbereitung der ÖU Daten

Die Pendelzielstatistik liefert durchschnittliche Werte für Pendeldistanzen nach verschiedenen Gliederungsmerkmalen, wie z.B. Bundesland, Geschlecht, Altersgruppe oder höchste abgeschlossene Schulbildung. Diese Werte liegen jeweils als gewichtete Mittelwerte vor25. Zunächst galt es daher, die entsprechenden Randsummen aus den „Österreich Unterwegs“ Datensätzen zu berechnen.

Die Ausgangsbasis war ein kombinierter Datensatz, in dem die Personenattribute und die Haushaltsattribute über die entsprechenden ID Variablen, bzw. der Erstellung einer kombinierten Personen-Haushalts ID (mit einem eindeutigen Werten für jede Person) an den ÖU Wegedatensatz angefügt wurden. In diesem Datensatz liegen nun für jeden Weg die zugeordneten personen- und haushaltspezifischen Attribute vor. Dabei ist zu

25 Auf Unterschiede zwischen den beiden Erhebungen Pendelzielstatistik und Österreich Unterwegs wird auch in AP4 hingewiesen.

beachten, dass dieser Datensatz keine Personen unter 6 Jahren enthält (diese scheinen weder im Wege- noch im Personendatensatz auf, da Kinder unter 6 Jahren nicht befragt wurden; sie sind allerdings in der Variable Haushaltsgröße im Haushaltsdatensatz berücksichtigt) sowie keine Personen (und folglich Haushalte) die an den Berichtsagen nicht mobil waren, d.h. für die keine Wege berichtet wurden.

Als nächster Schritt folgte eine Selektion der Wegezwecke: dazu wurde die Variable ‚weg_zweck‘ aus dem ÖU Wegedatensatz nach den Zwecken ‚zur Arbeit‘ (Code 10) und ‚Schule/Ausbildung‘ (Code 30) destruktiv gefiltert. Der Datensatz wurde mit dem Hochrechnungsfaktor ‚Wege-Hochrechnungsfaktor-WERKTAG‘ als SPSS frequency variable gewichtet. Die Gewichtung mit diesem Hochrechnungsfaktor führt dazu, dass manche Wege (die nicht werktäglichen Wege) mit Null gewichtet werden, diese Wege wurden ebenfalls destruktiv ausgefiltert. Die beiden Schritte (Filterung und Gewichtung) gewährleisten, dass die betrachteten Wege aus ÖU inhaltlich den in der Pendelzielstatistik repräsentierten Wegen bestmöglich entsprechen.

Zur Berechnung der gewichteten Mittelwerte wurden die Wege auf das Personen-niveau aggregiert. Dabei wurde so vorgegangen, dass die Wegelängen (‚weg_laenge‘) der (mittels ÖU Hochrechnungsfaktor) gewichteten Wege die einer bestimmten Person (kombinierte Haushalts und Wege ID, sodass für jede Person eine eindeutige ID vorlag) zugeordnet sind summiert werden. Nach diesem Schritt liegt ein aggregiertes File vor, in dem jeder Eintrag genau einer Person entspricht, und das die summieren Wegedistanzen und die summierten Wegeanzahlen als Spalten enthält. Die Summe der Wegedistanzen über alle Fälle (=mobile Personen) entsprechen jenen der Arbeits- und Ausbildungswege der Grundgesamtheit. Die Anzahl der Wege (die ebenfalls den hochgerechneten Wegeanzahlen entspricht) wurde dazu herangezogen, die zuvor beschriebene hochgerechnete Wegesumme zu mitteln, um eine (gewichtete) durchschnittliche Wegedistanz für Arbeits- und Ausbildungswege (eine Richtung) aller mobilen Personen zu berechnen. Demnach beträgt die durchschnittliche Pendeldistanz für ganz Österreich (über alle mobilen Personen) 14,28 km in eine Richtung.

An das zuvor erzeugte, auf Personenniveau aggregierte Datenfile wurden danach die zur weiteren Gliederung notwendigen Personen- und Haushaltsmerkmale angefügt. Zur Auswertung nach den in der Pendelzielstatistik verwendeten weiteren Gliederungsmerkmalen wurden verschiedene nicht destruktive SPSS Filtervariablen erstellt, um auch Auskreuzungen wie z.B. Altersklasse x Bundesland effizient handhaben zu können. In SPSS wurden dann die jeweiligen Randsummen berechnet samt der Anzahl der entsprechenden Wege (z.B.

Weglängensumme aller 20 bis 29-jährigen in der Steiermark) um danach in Excel die entsprechenden Durchschnittswerte zu errechnen. Diese stellen schließlich die Vergleichswerte zu den nach den verschiedenen Gliederungsmerkmalen in der Pendelzielstatistik erstellen Randsummen.

5.1.2. Ergebnisse

5.1.2.1. Pendeldistanzen nach Geschlecht und Bundesland

Wie aus Tabelle 12 ersichtlich ist, bestehen absolute Abweichungen zwischen den in der Pendelzielstatistik ausgewiesenen Pendeldistanzen und den entsprechenden Wegedistanzen aus „Österreich Unterwegs“.

Generell verzeichnet die PZS höhere Werte. Dafür gibt es folgende mögliche Gründe:

 Die Pendelzielstatistik ermittelt den schnellsten Straßenweg zwischen Wohn- bzw. Schul- und Arbeitsstättenadresse; dieser muss nicht notwendigerweise der kürzeste sein.

 Hat eine Person einen Nebenwohnsitz mit kurzer Distanz (wie in ÖU angegeben), verwendet die Pendelzielstatistik trotzdem den Hauptwohnsitz (Melderealität).

 Pendelt eine Person nicht jeden Tag oder zum Teil nur eine kürzere Strecke, ist dies in ÖU aber nicht in der Pendelzielstatistik abgebildet.

 Ein systematischer Unterschied zwischen subjektiv geschätzten Entfernungen in ÖU und errechnet Distanzen in der Pendelzielstatistik kann bestehen.

 Die Methodik bzw. das Regelwerk, mit der (in einer automatisierten Weise) der Wegezweck (d.h. der Hauptzweck des Weges) aus den erfragten Quell- und Zielzwecken (re-)konstruiert wurde, kann zu Abweichungen führen. Betrachtet man die Standardabweichungen der Wegelängen (für Ausbildungs- und Arbeitswege) einer Person sind diese z.T. außerordentlich hoch, obwohl nicht anzunehmen ist, dass die Wege zur Ausbildungs- und Arbeitsstätte jedes Mal eine andere Distanz haben (sofern die Ziele nicht häufig Wechseln); hohe personenspezifische Standardabweichungen könnten ein Hinweis darauf sein, dass die durch unvollständiges Reporting der Wege durch den/die RepsondentIn rekonstruierten Hauptzwecke Fehler enthalten.

Tabelle 12 Pendeldistanzen nach Geschlecht und Bundesland: PZS (durchschnittliche Distanz in km) und ÖU (mittlere Pendeldistanz in km (eine Richtung, mobile Personen; Arbeits- und Ausbildungswege))

Im Dokument „Österreich Unterwegs“ (Seite 59-65)