4.5.3. Zusammenhang Verknüpfungsvariablen und Verbrauchsausgaben insgesamt
Die folgende Regression mit den Daten der Konsumerhebung überprüft den Einfluss der Verknüpfungsvariablen auf das abhängige Merkmal „Verbrauchsausgaben insgesamt“. Auch dieser Zusammenhang erweist sich als hoch signifikant, wenn auch etwas geringer als im vorhergehenden Modell.
Die ausgewählten Variablen erklären 31,7% der Varianz. Den größten Einfluss zeigt in diesem Regressionsmodell die höchste abgeschlossene Schulbildung, gefolgt vom Vorhandensein eines Pkws.
(Tabelle 7). Einzig die Variable „Kinder im Haushalt“ ist nicht signifikant.
Unstandardisierte Koeffizienten
Standardisierte Koeffizienten
B Beta
Konstante -2320,7 ,000
Haushaltsgröße 240,4 ,137 ,000
Alter des Haushalts (Älteste Person)
22,1 ,166 ,000
Kinder im Haushalt -195,7 -,041 ,005
Höchste abgeschlossene Schulbildung des Haushalts
626,2 ,276 ,000
Erwerbstätigkeit 934,1 ,388 ,000
Haushalt mit Pensionseinkommen
458,4 ,149 ,000
Räumliche Einteilung -83,3 -,045 ,000
PKW vorhanden 421,4 ,161 ,000
Motorrad/Moped vorhanden 81,8 ,019 ,025
Fahrrad vorhanden 115,5 ,087 ,000
Nutzung von Benzin-Antrieb 80,8 ,017 ,057
Nutzung von Diesel-Antrieb 179,4 ,040 ,000
Private Nutzung von Firmenwagen
1151,6 ,140 ,000
Zeitkarte für den Öffentlichen Verkehr
184,9 ,039 ,000
Signifikanz Geschätzte Regressionskoeffizienten
Tabelle 7: Regression der Verknüpfungsvariablen auf die Verbrauchsausgaben insgesamt.
Q: Statistik Austria, Konsumerhebung.
4.5.4. Zusammenhang Verknüpfungsvariablen und Verbrauchsausgaben für Verkehr
Die nachfolgende Regression mit den Daten der Konsumerhebung überprüft den Zusammenhang der Verknüpfungsvariablen mit der abhängigen Variable „Verbrauchsausgaben für Verkehr insgesamt“. Der Modellzusammenhang ist wieder signifikant, wenn auch mit einem deutlich geringeren korrigierten R-Quadrat-Wert von 0,168 (d.h. 16,8% der Varianz der abhängigen Variable werden erklärt). Da die Verknüpfungsvariablen vorrangig in Hinblick auf ihren Zusammenhang mit dem Haushaltseinkommen sowie den Verbrauchsausgaben insgesamt ausgesucht wurden, war ein geringerer Modellzusammenhang zu erwarten. Die nachfolgende Übersicht zeigt jedoch, dass speziell die verkehrsrelevanten Merkmale einen hochsignifikanten Einfluss auf die Verkehrsausgaben haben.
Den höchsten Einfluss auf die abhängige Variable „Ausgaben für den Verkehr insgesamt“ zeigt der Pkw-Besitz, gefolgt von der Nutzung eines Diesel-Antriebs und der privaten Nutzung eines Firmenwagens. Sozio-demografische Variablen wie das Alter des Haushalts, Kinder im Haushalt oder ein Pensionseinkommen sind dagegen nicht signifikant.
Unstandardisierte Koeffizienten
Standardisierte Koeffizienten
B Beta
Konstante -451.9 .002
Haushaltsgröße 82.5 .050 .011
Alter des Haushalts (Älteste Person)
6.3 .051 .001
Kinder im Haushalt 45.7 .010 .557
Höchste abgeschlossene Schulbildung des Haushalts
403.6 .189 .000
Erwerbstätigkeit 326.0 .144 .000
Haushalt mit Pensionseinkommen
313.5 .108 .000
Räumliche Einteilung -45.7 -.026 .026
PKW vorhanden 453.1 .184 .000
Motorrad/Moped vorhanden 165.6 .042 .000
Fahrrad vorhanden 157.1 .126 .000
Nutzung von Benzin-Antrieb 322.1 .074 .000
Nutzung von Diesel-Antrieb 545.1 .130 .000
Private Nutzung von Firmenwagen
1102.1 .143 .000
Zeitkarte für den Öffentlichen Verkehr
166.9 .038 .001
Signifikanz Geschätzte Regressionskoeffizienten
Tabelle 8: Regression der Verknüpfungsvariablen auf die Ausgaben für den Verkehr insgesamt.
Q: Statistik Austria, Konsumerhebung.
Wie Tabelle 6 und Tabelle 7 darstellen, korrelieren alle ausgewählten Verknüpfungsvariablen (signifikant mit dem gesamten verfügbaren Haushaltseinkommen (Ausnahme Benzin-Antriebsowie den gesamten Verbrauchsausgaben (Ausnahme Kinder im Haushalt). Die verkehrsrelevanten Variablen zeigen zudem einen wesentlichen Einfluss auf die Ausgaben für den Verkehr insgesamt (Tabelle 8).
Das Heranziehen der ausgewählten Merkmale als Verknüpfungsvariablen wird durch dieses Ergebnis unterstützt – die zu verknüpfenden Variablen Haushaltseinkommen, Verbrauchsausgaben insgesamt und Verbrauchsausgaben für Verkehr sind ausreichend durch die Verknüpfungsvariablen erklärbar.
4.5.5. Gewichtung der Verknüpfungsvariablen für Statistical Matching
Bei der Durchführung des Statistical Matchings kann miteinbezogen werden, wie stark jede einzelne Variable eine abhängige Variable beeinflussen soll. Die Variablen können also verschieden stark gewichtet werden.
Der Variable zur Bildung kann beispielsweise im vorliegenden Fall ein höherer Einfluss – also ein höheres Gewicht – auf das Einkommen zugewiesen werden, als der räumlichen Einteilung.
Für die Gewichtung wurde der Zusammenhang der Verknüpfungsvariablen mit dem gesamten Haushaltseinkommen, den gesamten Verbrauchsausgaben sowie den gesamten Ausgaben für den Verkehr herangezogen. Es wurden drei Gruppen mit unterschiedlichen Gewichten gebildet (siehe Tabelle 9). Die Variablen der Gruppe „Gewicht 3“ sind im Durchschnitt am engsten mit dem Haushaltseinkommen und den Verbrauchsvariablen korreliert und gingen mit dem dreifachen Gewicht in die Distanzfunktion ein, jene der mittleren Gruppe „Gewicht 2“ mit dem Faktor zwei. Die dritte Gruppe „Gewicht 1“ war im Durchschnitt am geringsten mit dem Haushaltseinkommen und den Verbrauchsvariablen korreliert und ging daher mit einfachem Gewicht in die Distanzfunktion ein.
Unstandardisierte Koeffizienten
Standardisierte Koeffizienten
B Beta
Konstante -111,5 ,047
Haushaltsgröße -32,8 -,057 ,008
Alter des Haushalts (Älteste Person)
0,8 ,019 ,252
Kinder im Haushalt 7,4 ,005 ,801
Höchste abgeschlossene Schulbildung des Haushalts
27,9 ,038 ,002
Erwerbstätigkeit 41,3 ,053 ,005
Haushalt mit Pensionseinkommen
4,7 ,005 ,811
Räumliche Einteilung 1,5 ,002 ,847
PKW vorhanden 197,8 ,233 ,000
Motorrad/Moped vorhanden 37,7 ,028 ,014
Fahrrad vorhanden 21,7 ,050 ,000
Nutzung von Benzin-Antrieb 116,5 ,077 ,000
Nutzung von Diesel-Antrieb 235,1 ,163 ,000
Private Nutzung von Firmenwagen
381,5 ,143 ,000
Zeitkarte für den Öffentlichen Verkehr
41,2 ,027 ,028
Geschätzte Regressionskoeffizienten
Signifikanz
Tabelle 9: Gewichte der Verknüpfungsvariablen.
Q: Statistik Austria.
4.5.6. Durchführung Statistical Matching
Das Statistical Matching welches schlussendlich verwendet wurde ist ein Nearest-Neighbour Verfahren, wobei die in der Distanzfunktion verwendeten Variablen (und deren Gewichtung) auf Grund von Signifikanz-Tests bestimmt wurden.
Für jeden Datensatz von „Österreich unterwegs“ wurde ein Spender aus dem Datensatz der Konsumerhebung mit minimaler Distanz der Verknüpfungsvariablen gesucht, um die zu verknüpfenden Variablen (Haushaltseinkommen und Verbrauchsausgaben sowie in weiterer Folge Daten der Pendelzielstat istik) zu verbinden. Bei mehreren Spendern mit gleicher Distanz wurde einer zufällig ausgewählt.
Die Verknüpfungsvariablen Haushaltsgröße, Alter, Kinder, Erwerbstätigkeit, Pensionseinkommen, sowie die Anzahl der vorhandenen Fahrzeuge gehen als numerische Größe in das Modell ein. Die Variablen zu Bildung, räumlicher Einteilung, Antriebsarten, Firmenwagen sowie Zeitkartenbesitz werden als nominale Größen angesehen. Die entsprechenden Merkmalsausprägungen der Variablen sind in Tabelle 4 abgebildet.
Die Merkmale wurden wie erwähnt für die Distanzfunktion unterschiedlich gewichtet (Tabelle 9). Die Variablen zu Schulbildung, Erwerbstätigkeit, Pkw-Besitz, Firmenwagen und Diesel-Antrieb sind am engsten mit dem Haushaltseinkommen bzw. den Verbrauchsausgaben insgesamt korreliert und gingen mit dem dreifachen Gewicht in die Distanzfunktion ein. Die Variablen der mittleren Gruppe „Gewicht 2“ gingen mit dem Faktor zwei, „Gewicht 1“ ging mit einfachem Gewicht in die Distanzfunktion ein.
Bei der Distanzfunktion handelt es sich um eine verallgemeinerte Variante der Gower-Distanz-Funktion, welche im Original kategorische und stetige Variablen beinhaltet. Die Erweiterung besteht in der Möglichkeit ordinale und semi-stetige Variable in der Distanzfunktion zu verwenden.
Die Distanz zwischen Beobachtungen i und j ist durch folgende Formel
definiert, wobei p die Anzahl der Distanzvariablen ist, 𝑤𝑘 das Gewicht der jeweiligen Variable und 𝛿𝑖,𝑗,𝑘der Beitrag der k-ten Variable zur Distanz zwischen den Beobachtungen i und j.
Gewicht 1: Gewicht 2: Gewicht 3:
Kinder im Haushalt Haushaltsgröße Höchste abgeschlossene Schulbildung des Haushalts Räumliche Einteilung Alter des Haushalts (Älteste
Person) Erwerbstätigkeit
Motorrad/Moped vorhanden Haushalt mit
Pensionseinkommen PKW vorhanden Zeitkarte für den Öffentlichen
Verkehr Fahrrad vorhanden Private Nutzung von
Firmenwagen
Nutzung von Benzin-Antrieb Nutzung von Diesel-Antrieb
Für stetige Variablen ist der Distanzbeitrag definiert als
, wobei 𝑥∗,𝑘 der beobachtete der Variable k ist und 𝑟𝑘 die Spannweite dieser Variable ist.
Für nominale Variablen ist der Distanzbeitrag definiert als
Für semi-stetige Variablen der Distanzbeitrag ist eine Mischung aus der Funktion für nominale und stetige Variablen:
4.6. Beantwortbare Fragestellungen durch den erweiterten Datensatz
Die im vorliegenden Bericht angeführten Fragestellungen rund um den Mobilitätssektor ergeben sich wie erwähnt aus einer ganzheitlichen, interdisziplinären Betrachtung mobilitätsrelevanter Bereiche in Ökonomie, Ökologie, Sozialem und Technologie (mit Fokus auf Gesamtverkehrsplan und FTI-Roadmap). Die Fragen adressieren Themen, die für ein soziales, sicheres, umweltfreundliches und effizientes Verkehrssystem unabdingbar sind.
Durch eine statistische Verknüpfung der Datenbestände der Konsumerhebung 2014/2915 mit den Daten zu
„Österreich unterwegs“ kann ein umfassender Datensatz für die identifizierten Fragestellungen herangezogen werden, der vor allem neue Einblicke betreffend dem Ausgabenverhalten der Haushalte liefern könnte.
Zudem wird das gesamte verfügbare Haushaltseinkommen der Haushalte ebenfalls mittels Statistical Matching aus der Konsumerhebung 2014/2015 in „Österreich unterwegs“ eingefügt. Eine analytische Betrachtung von Einkommen und Mobilitätsverhalten ist damit ebenfalls vertiefend möglich.
Durch die Einbeziehung der Wegestrecken und Wegezeiten aus der Pendelzielstatistik 2015 könnten weitere interessante Ergebnisse auch in Hinblick auf das Pendelverhalten erzielt werden, sofern durch das Statistical Matching valide Daten zur Verfügung gestellt werden können.
Es soll diesbezüglich auf die Ergebnisse von AP2 ‚Ermittlung relevanter Fragestellungen/Indikatoren im/um den Mobilitätssektor‘ verwiesen werden und hier im speziellen auf die Fragen, die im Komplex ‚Einkommen, Ausgaben und Mobilitätsverhalten‘ zusammengefasst wurden. Dabei spielen die durch das Statistical Matching von Konsumerhebung und „Österreich Unterwegs“ hinzugefügten Variablen Haushaltseinkommen und Verbrauchsausgaben eine zentrale Rolle. Hier interessieren die Zusammenhänge zwischen Haushaltseinkommen, bzw. Äquivalenzeinkommen, Haushaltsausgaben für Mobilität und verschiedenen Dimensionen des Mobilitätsverhaltens. Weitere Fragestellungen beziehen sich auf Nachfrageelast izitäten und
Substitution zwischen verschiedenen Verbrauchsausgabenkategorien. Die gelisteten Fragestellungen sind – wie bereits im Gesamtverkehrsplan Österreich genannt – insbesondere für die Leistbarkeit der Mobilität im Sinne der Daseinsvorsorge relevant.
4.7. Evaluation der Ergebnisse des Statistical Matchings
Durch das beschriebene Statistical Matching Verfahren konnte dem Datensatz von „Österreich unterwegs“
zwar Einkommens- und Ausgabeninformationen zugeführt werden, doch liegt noch keine Information über die Qualität der Imputation vor. Die Datenvalidierung der Ergebnisse ist daher ein wichtiger Teil des Matching-Prozesses. Asmah (2010) unterscheidet dabei zwischen der internen und externen Evaluation.
Die interne Evaluation prüft, ob die im Empfängerdatensatz imputierten Werte die Informationen aus dem Spenderdatensatz gut widerspiegeln. Diese Evaluation erfolgt im aktuellen Kapitel.
Die externe Evaluation erfolgt, indem Analysen mit den Daten des Empfängerdatensatzes und den zugefügten Variablen durchgeführt werden. Wenn diese inhaltlichen Untersuchungen z.B. den durch Literaturanalysen gestützten Erwartungen entsprechen, wird die methodische Vorgehensweise bestätigt (für Ergebnisse dazu siehe Kapitel 5).
4.7.1. Datenvalidierung Haushaltseinkommen
Im folgenden Abschnitt wird das imputierte Haushaltseinkommen vom Empfängerdatensatz „Österreich unterwegs“ mit dem Haushaltseinkommen aus der Konsumerhebung und aus EU-SILC verglichen. Dabei werden verschieden Verteilungscharakteristika bzw. Lageparameter (wie Median oder Dezile) herangezogen.
Die Einkommensvariable der Konsumerhebung (gesamtes verfügbares monatliches Haushaltseinkommen, netto, ohne Entnahmen und imputierter Mieten) wird als Zwölftel des Jahresnettoeinkommens der Haushalte dargestellt. Dies ermöglicht eine optimale Vergleichbarkeit zwischen Ausgaben und Einkommen der Konsumerhebung. Die Einkommensvariable umfasst sämtliche monetären Einkommen (siehe auch Kronsteiner-Mann, 2017). Für eine Vergleichbarkeit der Einkommensvariable mit den Ausgabenkategorien inkludiert die Konsumerhebung zusätzlich Entnahmen aus dem eigenen Garten und/oder Betrieb und den einkommenswirksamen Teil der imputierten Mieten für eigentümergenutztes Wohnen. Diese beiden Komponenten (Entnahmen und imputierte Mieten) wurden für die zu verknüpfende Einkommensvariable nicht berücksichtigt, da sie gemeinhin auch nicht Teil der herkömmlichen Einkommensdefinition sind (beispielsweise wird das Haushaltseinkommen von EU-SILC17 ebenfalls ohne Entnahmen und imputierter Mieten berechnet).
Das durchschnittliche monatliche Haushaltseinkommen (arithmetisches Mittel) laut Konsumerhebung (ohne Entnahmen und imputierte Mieten) beträgt 3.252 Euro18, der Median liegt bei 2.712 Euro. Das einkommensschwächste Viertel der Haushalte verfügt über weniger als 1.677 Euro, die einkommensstärksten 25% haben monatlich mehr als 4.345 Euro zu Verfügung.
Die Verteilung des Haushaltseinkommens der Konsumerhebung wurde an die Einkommensverteilung der Daten von EU-SILC als Referenzgröße angepasst, laut EU-SILC liegen die Einkommenswerte für das Jahr
17 EU-SILC (European Community Statistics on Income and Living Conditions) ist die wesentliche Statistik über Einkommen und Lebensbedingungen von Privathaushalten in Europa und bildet eine wichtige Grundlage für die Europäische Sozialstatistik.
http://www.statistik.at/web_de/statistiken/menschen_und_gesellschaft/soziales/haushalts-einkommen/index.html
18 Das durchschnittliche monatliche Haushaltseinkommen inklusive Entnahmen und imputierten Mieten liegt bei 3.460 Euro, der Median bei 2.880 Euro.
2015 geringfügig über jenen der Konsumerhebung für das Jahr 2014/15 (Abbildung 12)19. Die Unterschiede erklären sich vorwiegend durch den unterschiedlichen Bezugszeitraum und Stichprobenabweichungen.
Demgegenüber weist die verknüpfte Einkommensvariable in „Österreich unterwegs“ durchschnittlich 3.735 Euro für das Jahreszwölftel aus und liegt damit um rund 15% über den 3.252 Euro der Konsumerhebung (verglichen werden die gewichteten Werte). Für das einkommensschwächste Viertel der Haushalte zeigt
„Österreich unterwegs“ ein Einkommen von maximal 2.612 Euro monatlich, der Median (50%) liegt bei 3.450 Euro. Beide Werte liegen jeweils wieder deutlich über den Originalwerten der Konsumerhebung. Die Unterschiede von „Österreich unterwegs“ zu EU-SILC sind durchgehend etwas geringer.
Die einkommensstärksten Haushalte haben monatlich mehr als 4.616 Euro zur Verfügung, die Einkommensunterschiede sind damit in den unteren Einkommensgruppen stärker ausgeprägt. Dies ist vermutlich in der Realisierung der Stichprobe in „Österreich unterwegs“ und der verwendeten Gewichtungssystematik begründet.
Nach den Dezilen (Neun Gruppengrenzen für 10 gleich große Gruppen, Abbildung 13) zeigen die Werte aus
„Österreich unterwegs“ bis zum 8. Dezil einen höheren Wert als jene in der Konsumerhebung. Erst mit dem 9.
Dezil sind die Werte der Konsumerhebung über jenen von „Österreich unterwegs“, was zum Teil wieder auf die unterschiedliche Gewichtungssystematik zurückzuführen ist.
Die Unterschiede von „Österreich unterwegs“ zu EU-SILC sind wieder durchgehend etwas geringer, da die Einkommenswerte aus EU-SILC für das Jahr 2015 wie erwähnt geringfügig über jenen der Konsumerhebung für das Jahr 2014/15 liegen (Ausnahme: 9. Dezil).
19 Da die Konsumerhebung 2014/15 mehrheitlich 2015 durchgeführt wurde (Ende Oktober 2014 – Anfang November 2015) wurde für den Vergleich EU-SILC 2016 mit dem Einkommensbezugsraum 2015 herangezogen.
Abbildung 12: Vergleich Einkommen Konsumerhebung und „Österreich unterwegs“ – Quartile.
Q: Statistik Austria, EU-SILC 2016 (Einkommensreferenzjahr 2015), Konsumerhebung 2014/15,