• Keine Ergebnisse gefunden

Statistik Austria, Konsumerhebung

Im Dokument „Österreich Unterwegs“ (Seite 43-50)

4.5.3. Zusammenhang Verknüpfungsvariablen und Verbrauchsausgaben insgesamt

Die folgende Regression mit den Daten der Konsumerhebung überprüft den Einfluss der Verknüpfungsvariablen auf das abhängige Merkmal „Verbrauchsausgaben insgesamt“. Auch dieser Zusammenhang erweist sich als hoch signifikant, wenn auch etwas geringer als im vorhergehenden Modell.

Die ausgewählten Variablen erklären 31,7% der Varianz. Den größten Einfluss zeigt in diesem Regressionsmodell die höchste abgeschlossene Schulbildung, gefolgt vom Vorhandensein eines Pkws.

(Tabelle 7). Einzig die Variable „Kinder im Haushalt“ ist nicht signifikant.

Unstandardisierte Koeffizienten

Standardisierte Koeffizienten

B Beta

Konstante -2320,7 ,000

Haushaltsgröße 240,4 ,137 ,000

Alter des Haushalts (Älteste Person)

22,1 ,166 ,000

Kinder im Haushalt -195,7 -,041 ,005

Höchste abgeschlossene Schulbildung des Haushalts

626,2 ,276 ,000

Erwerbstätigkeit 934,1 ,388 ,000

Haushalt mit Pensionseinkommen

458,4 ,149 ,000

Räumliche Einteilung -83,3 -,045 ,000

PKW vorhanden 421,4 ,161 ,000

Motorrad/Moped vorhanden 81,8 ,019 ,025

Fahrrad vorhanden 115,5 ,087 ,000

Nutzung von Benzin-Antrieb 80,8 ,017 ,057

Nutzung von Diesel-Antrieb 179,4 ,040 ,000

Private Nutzung von Firmenwagen

1151,6 ,140 ,000

Zeitkarte für den Öffentlichen Verkehr

184,9 ,039 ,000

Signifikanz Geschätzte Regressionskoeffizienten

Tabelle 7: Regression der Verknüpfungsvariablen auf die Verbrauchsausgaben insgesamt.

Q: Statistik Austria, Konsumerhebung.

4.5.4. Zusammenhang Verknüpfungsvariablen und Verbrauchsausgaben für Verkehr

Die nachfolgende Regression mit den Daten der Konsumerhebung überprüft den Zusammenhang der Verknüpfungsvariablen mit der abhängigen Variable „Verbrauchsausgaben für Verkehr insgesamt“. Der Modellzusammenhang ist wieder signifikant, wenn auch mit einem deutlich geringeren korrigierten R-Quadrat-Wert von 0,168 (d.h. 16,8% der Varianz der abhängigen Variable werden erklärt). Da die Verknüpfungsvariablen vorrangig in Hinblick auf ihren Zusammenhang mit dem Haushaltseinkommen sowie den Verbrauchsausgaben insgesamt ausgesucht wurden, war ein geringerer Modellzusammenhang zu erwarten. Die nachfolgende Übersicht zeigt jedoch, dass speziell die verkehrsrelevanten Merkmale einen hochsignifikanten Einfluss auf die Verkehrsausgaben haben.

Den höchsten Einfluss auf die abhängige Variable „Ausgaben für den Verkehr insgesamt“ zeigt der Pkw-Besitz, gefolgt von der Nutzung eines Diesel-Antriebs und der privaten Nutzung eines Firmenwagens. Sozio-demografische Variablen wie das Alter des Haushalts, Kinder im Haushalt oder ein Pensionseinkommen sind dagegen nicht signifikant.

Unstandardisierte Koeffizienten

Standardisierte Koeffizienten

B Beta

Konstante -451.9 .002

Haushaltsgröße 82.5 .050 .011

Alter des Haushalts (Älteste Person)

6.3 .051 .001

Kinder im Haushalt 45.7 .010 .557

Höchste abgeschlossene Schulbildung des Haushalts

403.6 .189 .000

Erwerbstätigkeit 326.0 .144 .000

Haushalt mit Pensionseinkommen

313.5 .108 .000

Räumliche Einteilung -45.7 -.026 .026

PKW vorhanden 453.1 .184 .000

Motorrad/Moped vorhanden 165.6 .042 .000

Fahrrad vorhanden 157.1 .126 .000

Nutzung von Benzin-Antrieb 322.1 .074 .000

Nutzung von Diesel-Antrieb 545.1 .130 .000

Private Nutzung von Firmenwagen

1102.1 .143 .000

Zeitkarte für den Öffentlichen Verkehr

166.9 .038 .001

Signifikanz Geschätzte Regressionskoeffizienten

Tabelle 8: Regression der Verknüpfungsvariablen auf die Ausgaben für den Verkehr insgesamt.

Q: Statistik Austria, Konsumerhebung.

Wie Tabelle 6 und Tabelle 7 darstellen, korrelieren alle ausgewählten Verknüpfungsvariablen (signifikant mit dem gesamten verfügbaren Haushaltseinkommen (Ausnahme Benzin-Antriebsowie den gesamten Verbrauchsausgaben (Ausnahme Kinder im Haushalt). Die verkehrsrelevanten Variablen zeigen zudem einen wesentlichen Einfluss auf die Ausgaben für den Verkehr insgesamt (Tabelle 8).

Das Heranziehen der ausgewählten Merkmale als Verknüpfungsvariablen wird durch dieses Ergebnis unterstützt – die zu verknüpfenden Variablen Haushaltseinkommen, Verbrauchsausgaben insgesamt und Verbrauchsausgaben für Verkehr sind ausreichend durch die Verknüpfungsvariablen erklärbar.

4.5.5. Gewichtung der Verknüpfungsvariablen für Statistical Matching

Bei der Durchführung des Statistical Matchings kann miteinbezogen werden, wie stark jede einzelne Variable eine abhängige Variable beeinflussen soll. Die Variablen können also verschieden stark gewichtet werden.

Der Variable zur Bildung kann beispielsweise im vorliegenden Fall ein höherer Einfluss – also ein höheres Gewicht – auf das Einkommen zugewiesen werden, als der räumlichen Einteilung.

Für die Gewichtung wurde der Zusammenhang der Verknüpfungsvariablen mit dem gesamten Haushaltseinkommen, den gesamten Verbrauchsausgaben sowie den gesamten Ausgaben für den Verkehr herangezogen. Es wurden drei Gruppen mit unterschiedlichen Gewichten gebildet (siehe Tabelle 9). Die Variablen der Gruppe „Gewicht 3“ sind im Durchschnitt am engsten mit dem Haushaltseinkommen und den Verbrauchsvariablen korreliert und gingen mit dem dreifachen Gewicht in die Distanzfunktion ein, jene der mittleren Gruppe „Gewicht 2“ mit dem Faktor zwei. Die dritte Gruppe „Gewicht 1“ war im Durchschnitt am geringsten mit dem Haushaltseinkommen und den Verbrauchsvariablen korreliert und ging daher mit einfachem Gewicht in die Distanzfunktion ein.

Unstandardisierte Koeffizienten

Standardisierte Koeffizienten

B Beta

Konstante -111,5 ,047

Haushaltsgröße -32,8 -,057 ,008

Alter des Haushalts (Älteste Person)

0,8 ,019 ,252

Kinder im Haushalt 7,4 ,005 ,801

Höchste abgeschlossene Schulbildung des Haushalts

27,9 ,038 ,002

Erwerbstätigkeit 41,3 ,053 ,005

Haushalt mit Pensionseinkommen

4,7 ,005 ,811

Räumliche Einteilung 1,5 ,002 ,847

PKW vorhanden 197,8 ,233 ,000

Motorrad/Moped vorhanden 37,7 ,028 ,014

Fahrrad vorhanden 21,7 ,050 ,000

Nutzung von Benzin-Antrieb 116,5 ,077 ,000

Nutzung von Diesel-Antrieb 235,1 ,163 ,000

Private Nutzung von Firmenwagen

381,5 ,143 ,000

Zeitkarte für den Öffentlichen Verkehr

41,2 ,027 ,028

Geschätzte Regressionskoeffizienten

Signifikanz

Tabelle 9: Gewichte der Verknüpfungsvariablen.

Q: Statistik Austria.

4.5.6. Durchführung Statistical Matching

Das Statistical Matching welches schlussendlich verwendet wurde ist ein Nearest-Neighbour Verfahren, wobei die in der Distanzfunktion verwendeten Variablen (und deren Gewichtung) auf Grund von Signifikanz-Tests bestimmt wurden.

Für jeden Datensatz von „Österreich unterwegs“ wurde ein Spender aus dem Datensatz der Konsumerhebung mit minimaler Distanz der Verknüpfungsvariablen gesucht, um die zu verknüpfenden Variablen (Haushaltseinkommen und Verbrauchsausgaben sowie in weiterer Folge Daten der Pendelzielstat istik) zu verbinden. Bei mehreren Spendern mit gleicher Distanz wurde einer zufällig ausgewählt.

Die Verknüpfungsvariablen Haushaltsgröße, Alter, Kinder, Erwerbstätigkeit, Pensionseinkommen, sowie die Anzahl der vorhandenen Fahrzeuge gehen als numerische Größe in das Modell ein. Die Variablen zu Bildung, räumlicher Einteilung, Antriebsarten, Firmenwagen sowie Zeitkartenbesitz werden als nominale Größen angesehen. Die entsprechenden Merkmalsausprägungen der Variablen sind in Tabelle 4 abgebildet.

Die Merkmale wurden wie erwähnt für die Distanzfunktion unterschiedlich gewichtet (Tabelle 9). Die Variablen zu Schulbildung, Erwerbstätigkeit, Pkw-Besitz, Firmenwagen und Diesel-Antrieb sind am engsten mit dem Haushaltseinkommen bzw. den Verbrauchsausgaben insgesamt korreliert und gingen mit dem dreifachen Gewicht in die Distanzfunktion ein. Die Variablen der mittleren Gruppe „Gewicht 2“ gingen mit dem Faktor zwei, „Gewicht 1“ ging mit einfachem Gewicht in die Distanzfunktion ein.

Bei der Distanzfunktion handelt es sich um eine verallgemeinerte Variante der Gower-Distanz-Funktion, welche im Original kategorische und stetige Variablen beinhaltet. Die Erweiterung besteht in der Möglichkeit ordinale und semi-stetige Variable in der Distanzfunktion zu verwenden.

Die Distanz zwischen Beobachtungen i und j ist durch folgende Formel

definiert, wobei p die Anzahl der Distanzvariablen ist, 𝑤𝑘 das Gewicht der jeweiligen Variable und 𝛿𝑖,𝑗,𝑘der Beitrag der k-ten Variable zur Distanz zwischen den Beobachtungen i und j.

Gewicht 1: Gewicht 2: Gewicht 3:

Kinder im Haushalt Haushaltsgröße Höchste abgeschlossene Schulbildung des Haushalts Räumliche Einteilung Alter des Haushalts (Älteste

Person) Erwerbstätigkeit

Motorrad/Moped vorhanden Haushalt mit

Pensionseinkommen PKW vorhanden Zeitkarte für den Öffentlichen

Verkehr Fahrrad vorhanden Private Nutzung von

Firmenwagen

Nutzung von Benzin-Antrieb Nutzung von Diesel-Antrieb

Für stetige Variablen ist der Distanzbeitrag definiert als

, wobei 𝑥∗,𝑘 der beobachtete der Variable k ist und 𝑟𝑘 die Spannweite dieser Variable ist.

Für nominale Variablen ist der Distanzbeitrag definiert als

Für semi-stetige Variablen der Distanzbeitrag ist eine Mischung aus der Funktion für nominale und stetige Variablen:

4.6. Beantwortbare Fragestellungen durch den erweiterten Datensatz

Die im vorliegenden Bericht angeführten Fragestellungen rund um den Mobilitätssektor ergeben sich wie erwähnt aus einer ganzheitlichen, interdisziplinären Betrachtung mobilitätsrelevanter Bereiche in Ökonomie, Ökologie, Sozialem und Technologie (mit Fokus auf Gesamtverkehrsplan und FTI-Roadmap). Die Fragen adressieren Themen, die für ein soziales, sicheres, umweltfreundliches und effizientes Verkehrssystem unabdingbar sind.

Durch eine statistische Verknüpfung der Datenbestände der Konsumerhebung 2014/2915 mit den Daten zu

„Österreich unterwegs“ kann ein umfassender Datensatz für die identifizierten Fragestellungen herangezogen werden, der vor allem neue Einblicke betreffend dem Ausgabenverhalten der Haushalte liefern könnte.

Zudem wird das gesamte verfügbare Haushaltseinkommen der Haushalte ebenfalls mittels Statistical Matching aus der Konsumerhebung 2014/2015 in „Österreich unterwegs“ eingefügt. Eine analytische Betrachtung von Einkommen und Mobilitätsverhalten ist damit ebenfalls vertiefend möglich.

Durch die Einbeziehung der Wegestrecken und Wegezeiten aus der Pendelzielstatistik 2015 könnten weitere interessante Ergebnisse auch in Hinblick auf das Pendelverhalten erzielt werden, sofern durch das Statistical Matching valide Daten zur Verfügung gestellt werden können.

Es soll diesbezüglich auf die Ergebnisse von AP2 ‚Ermittlung relevanter Fragestellungen/Indikatoren im/um den Mobilitätssektor‘ verwiesen werden und hier im speziellen auf die Fragen, die im Komplex ‚Einkommen, Ausgaben und Mobilitätsverhalten‘ zusammengefasst wurden. Dabei spielen die durch das Statistical Matching von Konsumerhebung und „Österreich Unterwegs“ hinzugefügten Variablen Haushaltseinkommen und Verbrauchsausgaben eine zentrale Rolle. Hier interessieren die Zusammenhänge zwischen Haushaltseinkommen, bzw. Äquivalenzeinkommen, Haushaltsausgaben für Mobilität und verschiedenen Dimensionen des Mobilitätsverhaltens. Weitere Fragestellungen beziehen sich auf Nachfrageelast izitäten und

Substitution zwischen verschiedenen Verbrauchsausgabenkategorien. Die gelisteten Fragestellungen sind – wie bereits im Gesamtverkehrsplan Österreich genannt – insbesondere für die Leistbarkeit der Mobilität im Sinne der Daseinsvorsorge relevant.

4.7. Evaluation der Ergebnisse des Statistical Matchings

Durch das beschriebene Statistical Matching Verfahren konnte dem Datensatz von „Österreich unterwegs“

zwar Einkommens- und Ausgabeninformationen zugeführt werden, doch liegt noch keine Information über die Qualität der Imputation vor. Die Datenvalidierung der Ergebnisse ist daher ein wichtiger Teil des Matching-Prozesses. Asmah (2010) unterscheidet dabei zwischen der internen und externen Evaluation.

Die interne Evaluation prüft, ob die im Empfängerdatensatz imputierten Werte die Informationen aus dem Spenderdatensatz gut widerspiegeln. Diese Evaluation erfolgt im aktuellen Kapitel.

Die externe Evaluation erfolgt, indem Analysen mit den Daten des Empfängerdatensatzes und den zugefügten Variablen durchgeführt werden. Wenn diese inhaltlichen Untersuchungen z.B. den durch Literaturanalysen gestützten Erwartungen entsprechen, wird die methodische Vorgehensweise bestätigt (für Ergebnisse dazu siehe Kapitel 5).

4.7.1. Datenvalidierung Haushaltseinkommen

Im folgenden Abschnitt wird das imputierte Haushaltseinkommen vom Empfängerdatensatz „Österreich unterwegs“ mit dem Haushaltseinkommen aus der Konsumerhebung und aus EU-SILC verglichen. Dabei werden verschieden Verteilungscharakteristika bzw. Lageparameter (wie Median oder Dezile) herangezogen.

Die Einkommensvariable der Konsumerhebung (gesamtes verfügbares monatliches Haushaltseinkommen, netto, ohne Entnahmen und imputierter Mieten) wird als Zwölftel des Jahresnettoeinkommens der Haushalte dargestellt. Dies ermöglicht eine optimale Vergleichbarkeit zwischen Ausgaben und Einkommen der Konsumerhebung. Die Einkommensvariable umfasst sämtliche monetären Einkommen (siehe auch Kronsteiner-Mann, 2017). Für eine Vergleichbarkeit der Einkommensvariable mit den Ausgabenkategorien inkludiert die Konsumerhebung zusätzlich Entnahmen aus dem eigenen Garten und/oder Betrieb und den einkommenswirksamen Teil der imputierten Mieten für eigentümergenutztes Wohnen. Diese beiden Komponenten (Entnahmen und imputierte Mieten) wurden für die zu verknüpfende Einkommensvariable nicht berücksichtigt, da sie gemeinhin auch nicht Teil der herkömmlichen Einkommensdefinition sind (beispielsweise wird das Haushaltseinkommen von EU-SILC17 ebenfalls ohne Entnahmen und imputierter Mieten berechnet).

Das durchschnittliche monatliche Haushaltseinkommen (arithmetisches Mittel) laut Konsumerhebung (ohne Entnahmen und imputierte Mieten) beträgt 3.252 Euro18, der Median liegt bei 2.712 Euro. Das einkommensschwächste Viertel der Haushalte verfügt über weniger als 1.677 Euro, die einkommensstärksten 25% haben monatlich mehr als 4.345 Euro zu Verfügung.

Die Verteilung des Haushaltseinkommens der Konsumerhebung wurde an die Einkommensverteilung der Daten von EU-SILC als Referenzgröße angepasst, laut EU-SILC liegen die Einkommenswerte für das Jahr

17 EU-SILC (European Community Statistics on Income and Living Conditions) ist die wesentliche Statistik über Einkommen und Lebensbedingungen von Privathaushalten in Europa und bildet eine wichtige Grundlage für die Europäische Sozialstatistik.

http://www.statistik.at/web_de/statistiken/menschen_und_gesellschaft/soziales/haushalts-einkommen/index.html

18 Das durchschnittliche monatliche Haushaltseinkommen inklusive Entnahmen und imputierten Mieten liegt bei 3.460 Euro, der Median bei 2.880 Euro.

2015 geringfügig über jenen der Konsumerhebung für das Jahr 2014/15 (Abbildung 12)19. Die Unterschiede erklären sich vorwiegend durch den unterschiedlichen Bezugszeitraum und Stichprobenabweichungen.

Demgegenüber weist die verknüpfte Einkommensvariable in „Österreich unterwegs“ durchschnittlich 3.735 Euro für das Jahreszwölftel aus und liegt damit um rund 15% über den 3.252 Euro der Konsumerhebung (verglichen werden die gewichteten Werte). Für das einkommensschwächste Viertel der Haushalte zeigt

„Österreich unterwegs“ ein Einkommen von maximal 2.612 Euro monatlich, der Median (50%) liegt bei 3.450 Euro. Beide Werte liegen jeweils wieder deutlich über den Originalwerten der Konsumerhebung. Die Unterschiede von „Österreich unterwegs“ zu EU-SILC sind durchgehend etwas geringer.

Die einkommensstärksten Haushalte haben monatlich mehr als 4.616 Euro zur Verfügung, die Einkommensunterschiede sind damit in den unteren Einkommensgruppen stärker ausgeprägt. Dies ist vermutlich in der Realisierung der Stichprobe in „Österreich unterwegs“ und der verwendeten Gewichtungssystematik begründet.

Nach den Dezilen (Neun Gruppengrenzen für 10 gleich große Gruppen, Abbildung 13) zeigen die Werte aus

„Österreich unterwegs“ bis zum 8. Dezil einen höheren Wert als jene in der Konsumerhebung. Erst mit dem 9.

Dezil sind die Werte der Konsumerhebung über jenen von „Österreich unterwegs“, was zum Teil wieder auf die unterschiedliche Gewichtungssystematik zurückzuführen ist.

Die Unterschiede von „Österreich unterwegs“ zu EU-SILC sind wieder durchgehend etwas geringer, da die Einkommenswerte aus EU-SILC für das Jahr 2015 wie erwähnt geringfügig über jenen der Konsumerhebung für das Jahr 2014/15 liegen (Ausnahme: 9. Dezil).

19 Da die Konsumerhebung 2014/15 mehrheitlich 2015 durchgeführt wurde (Ende Oktober 2014 – Anfang November 2015) wurde für den Vergleich EU-SILC 2016 mit dem Einkommensbezugsraum 2015 herangezogen.

Abbildung 12: Vergleich Einkommen Konsumerhebung und „Österreich unterwegs“ – Quartile.

Q: Statistik Austria, EU-SILC 2016 (Einkommensreferenzjahr 2015), Konsumerhebung 2014/15,

Im Dokument „Österreich Unterwegs“ (Seite 43-50)