You are on page 1of 5

Ein Großhändler, der in verschiedenen Regionen Portugals tätig ist, verfügt über Informationen über die

jährlichen Ausgaben mehrerer Artikel in seinen Geschäften in verschiedenen Regionen und Kanälen. Die
Daten bestehen aus den jährlichen Ausgaben von 440 großen Einzelhändlern für 6 verschiedene
Produktarten in 3 verschiedenen Regionen (Lissabon, Porto, Andere) und über verschiedene Vertriebskanäle
(Hotel, Einzelhandel).

1.1 Verwenden Sie Methoden der deskriptiven Statistik, um Daten zusammenzufassen. Welche Region und
welcher Kanal haben die meisten Ausgaben getätigt? Welche Region und welcher Kanal hat am
wenigsten ausgegeben?

a. Mit der Funktion describe in Python haben wir uns zunächst die grundlegenden deskriptiven
Statistiken des Datensatzes angesehen.

Lösung:

Beispiel des Datensatzes:

Explorative Datenanalyse

Lassen Sie uns die Arten von Variablen überprüfen & fehlende Werte im
Datenrahmen
Korrelationsdiagramm
b. Welche Region und welcher Kanal hat am meisten ausgegeben? Welche Region und welcher Kanal
hat am wenigsten ausgegeben?

Mithilfe des Balkendiagramms mit Region und Kanal konnten wir Regionen mit maximalen Ausgaben
und minimalen Ausgaben identifizieren. Die höchsten Ausgaben in der Region stammen von Anderen
und die niedrigsten Ausgaben in der Region stammen von Porto, während die höchsten Ausgaben im
Channel von Hotel und die niedrigsten Ausgaben im Channel von Einzelhandel stammen.

1.2 Es gibt 6 verschiedene Arten von Artikeln, die berücksichtigt werden. Beschreiben und
kommentieren/erklären Sie alle Sorten über Region und Kanal hinweg? Geben Sie eine detaillierte
Begründung für Ihre Antwort an.

Maß der zentralen Tendenz - Mittelwert, Median, Modus Maß der Dispersion - Bereich, IQR,
Standardabweichung

Aus den beiden oben beschriebenen Funktionen können wir die folgenden

 Der Kanal hat zwei eindeutige Werte, wobei" Hotel" mit 298 von 440 Transaktionen am häufigsten ist.
D.h. 67,7 Prozent der Ausgaben stammen vom "Hotel" -Kanal.

 Der Einzelhandel hat drei eindeutige Werte, wobei "Other" mit 316 von 440 Transaktionen am
häufigsten ist, d. h. 71,8 Prozent der Ausgaben stammen aus der "Other" -Region.

 Der frische Artikel hat einen Mittelwert von 12000,3, eine Standardabweichung von 12647,3, einen
Minimalwert von 3 und einen Maximalwert von 112151. Der andere Aspekt ist Q1(25%) ist 3127,75,
Q3(75%) ist 16933,8, mit Q2(50%) 8504 Bereich = max-min =112151-3=112.148 & IQR = Q3-Q1 =
16933,8-3127,75 = 13.806,05
 Milchartikel hat einen Mittelwert von 5796,27, eine Standardabweichung von 7380,38, einen
Minimalwert von 55 und einen Maximalwert von 73498. Der andere Aspekt ist Q1(25 %) ist 1533,
Q3(75 %) ist 7190,25, mit Q2(50 %) 3627. Bereich = max-min =73498-55=73443 & IQR = Q3-Q1 =
7190,25-1533 = 5657,25

 Der Lebensmittelartikel hat einen Mittelwert von 7951,28, eine Standardabweichung von 9503,16,
einen Minimalwert von 3 und einen Maximalwert von 92780. Der andere Aspekt ist Q1(25 %) ist 2153,
Q3(75 %) ist 10655,8, mit Q2(50 %) 4755,5. Bereich = max-min =92780-3=92777 & IQR = Q3-Q1 =
10655,8-2153 = 8502.

 Frozen hat einen Mittelwert von 3071,93, eine Standardabweichung von 4854,67, mit einem
Minimalwert von 25 und einem Maximalwert von 60869. Der andere Aspekt ist Q1(25%) ist 742,25,
Q3(75%) ist 3554,25, mit Q2(50%) 1526 Bereich = max-min =60869-25=60844 & IQR = Q3-Q1 =
3554,25-742,25 = 2812

 Waschmittelpapier hat einen Mittelwert von 2881,49, eine Standardabweichung von 4767,85, einen
Minimalwert von 3 und einen Maximalwert von 40827. Der andere Aspekt ist Q1(25%) ist 256,75,
Q3(75%) ist 3922, mit Q2(50%) 816,5.Range = max-min =40827-3=40824 & IQR = Q3-Q1 = 3922-
256,75 = 3665,25

 Feinkost hat einen Mittelwert von 1524,87, eine Standardabweichung von 2820,11, mit einem
Minimalwert von 3 und einem Maximalwert von 47943. Der andere Aspekt ist Q1(25 %) ist 408,25,
Q3(75 %) ist 1820,25, mit Q2(50 %) 965,5. Bereich = max-min =47943-3=47940 & IQR = Q3-Q1 =
1820,25-408,25 = 1412

1.3 Welches Element zeigt auf der Grundlage eines beschreibenden Maßes für die Variabilität das
inkonsistenteste Verhalten? Welche Elemente zeigen das am wenigsten inkonsistente Verhalten?

Lösung:

Verwendung des Variationskoeffizienten

Frischer Artikel hat den niedrigsten Variationskoeffizienten, also den konsistenten & Feinkostartikel
hat den höchsten Variationskoeffizienten, also den inkonsistenten.

1.4 Gibt es Ausreißer in den Daten? Untermauern Sie Ihre Antwort mit einer geeigneten
Darstellung/Technik mit Hilfe detaillierter Kommentare.

Lösung:

Um Ausreißer herauszufinden, haben wir Boxplot geplottet und ja, es gibt Ausreißer in allen Artikeln der
gesamten Produktpalette (Frisch, Milch, Lebensmittel, Tiefkühl, Reinigungsmittel, Papier & amp; Feinkost)
1.5 Was sind auf der Grundlage Ihrer Analyse Ihre Empfehlungen für das Unternehmen? Wie kann Ihre
Analyse dem Unternehmen helfen, sein Problem zu lösen? Antwort aus betriebswirtschaftlicher Sicht

Gemäß der Analyse stelle ich fest, dass es Inkonsistenzen bei den Ausgaben verschiedener Posten gibt (durch
Berechnung des Variationskoeffizienten), die minimiert werden sollten. Die Ausgaben des Hotel- und
Einzelhandelskanals sind unterschiedlich und sollten mehr oder weniger gleich sein. Und auch die Ausgaben
sollten für verschiedene Regionen gleich sein. Muss sich auch auf andere Artikel als "Frisch" und
"Lebensmittel" konzentrieren

You might also like