GNU R - Rkward: Unterschied zwischen den Versionen

Aus Linux Bibel
Wechseln zu: Navigation, Suche
K
K
 
Zeile 1: Zeile 1:
 
[[Category:Software]][[Category:Office]][[Category:Entwicklung]]
 
[[Category:Software]][[Category:Office]][[Category:Entwicklung]]
 +
<seo title="GNU R - Sprache für Statistiken unter Linux" metakeywords="linux,debian,ubuntu,kubuntu,mint,solus,fedora,manjaro,mageia,opensuse,gnu,r,rkward,gnu-r,sprache,software,für,professionelle,statistiken,unter,installieren,nutzen" metadescription="GNU-R ist eine professionelle Sprache für Statistiken unter Linux, Rkward ist die passende grafische Oberfläche dazu, wie Sie beides nutzen zeigt Ihnen dieser Beitrag auf der Linux Bibel" google-site-verification="AVSf_G9kQatS3exsfCCg77wPWhSUOFOgAeO7NEk2SSQ" />
 
== Informationen ==
 
== Informationen ==
 
Wenn es unter Microsoft Windows um professionelle Statistiken geht kommt man meist ohne die Software SPSS von IBM oder Stata nicht aus, wieder einmal könnte man meinen das es hier keine Alternative unter Linux gibt und wieder einmal liegt man ganz falsch. Für die etwas einfacheren Statistiken ist hier problemlos die Software [[PSPP]] einsatzfähig, diese Software kommt bis auf wenige Details problemlos an die Software von IBM heran, will man aber das volle Programm - diese kommerzielle Software um alles übertreffen dann führt man sich GNU R zu Gute.
 
Wenn es unter Microsoft Windows um professionelle Statistiken geht kommt man meist ohne die Software SPSS von IBM oder Stata nicht aus, wieder einmal könnte man meinen das es hier keine Alternative unter Linux gibt und wieder einmal liegt man ganz falsch. Für die etwas einfacheren Statistiken ist hier problemlos die Software [[PSPP]] einsatzfähig, diese Software kommt bis auf wenige Details problemlos an die Software von IBM heran, will man aber das volle Programm - diese kommerzielle Software um alles übertreffen dann führt man sich GNU R zu Gute.

Aktuelle Version vom 13. Mai 2018, 19:51 Uhr

Informationen

Wenn es unter Microsoft Windows um professionelle Statistiken geht kommt man meist ohne die Software SPSS von IBM oder Stata nicht aus, wieder einmal könnte man meinen das es hier keine Alternative unter Linux gibt und wieder einmal liegt man ganz falsch. Für die etwas einfacheren Statistiken ist hier problemlos die Software PSPP einsatzfähig, diese Software kommt bis auf wenige Details problemlos an die Software von IBM heran, will man aber das volle Programm - diese kommerzielle Software um alles übertreffen dann führt man sich GNU R zu Gute.

GNU R ist nicht nur einfach eine Statistik-Software sondern wenn man noch mehr will eine eigene Programmiersprache - genau gesagt eine freie Variante von S-Plus. Damit lassen sich Statistiken nicht nur von Hand in einer grafischen Oberfläche erstellen sondern problemlos auch Statistiken aus allen möglichen Datenquellen, wie etwa Datenbanken, Dokumenten, von Eingaben aus Webseiten und und und automatisch erstellen. Die Möglichkeiten dieser Software sind schier unbegrenzt.

In diesem Beitrag wollen wir als erstes einmal die einfache Variante - also die grafische Oberfläche ansehen und wie man diese nutzt und später wie wir Daten von allen möglichen Daten-Quellen automatisch erfassen und auswerten lassen. Die wohl bekannteste grafische Oberfläche ist Rkward, eigentlich eine auf die Desktop-Umgebung KDE angepasste Software - läuft jedoch auch problemlos unter allen anderen Desktop-Umgebungen.

Rkward installieren

Unter auf Debian basierenden Systemen wie Ubuntu, Kubuntu, Linux Mint, Budgie, Knoppix und so weiter und so fort installieren Sie diese Software ganz einfach über die Paket-Verwaltung APT - Software installieren, löschen, aktualisieren durch die Pakete "rkward r-base".

Rkward nutzen

Nach der Installation finden Sie die Software im Anwendungsmenü im Bereich "Wissenschaft & Mathematik", alternativ starten Sie die Anwendung wie üblich über den Schnellstarter (Alt + F2) oder über das Terminal durch den Befehl:

rkward
Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken

Je nachdem ob man schon mit der Software gearbeitet hat oder nicht wählt man nun den leeren Arbeitsbereich, eine leere Tabelle oder einen vorhandenen Arbeitsbereich. Zu Beginn eines neuen Projektes empfehle ich ganz einfach den leeren Bereich, er bietet auch gleich einen kleinen Einstieg in diese Software sowie zu GNU R:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Projekt starten

Nun wollen wir hier nicht lange lamentieren sondern einfach und schnell eine einfache Statistik erstellen, wirklich alle Funktionen der Software zu beschreiben wäre fast ein Ding der Unmöglichkeit - hierzu findet sich im Menü "Hilfe" auch ein umfangreicher Datensatz:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Projekt starten

Die Hilfe und weitere Fenster werden in der Software auf einzelnen Reitern geöffnet, Sie können diese also immer geöffnet lassen um so immer schnellen Zugang zu haben - GNU R ist alles andere als mangelhafte Software. Ganz links im Fenster finden Sie zusätzlich das Menü für Dateien und Arbeitsbereiche:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Dateien und Arbeitsbereich

Um ein neues Projekt anzulegen nutzen wir das Menü "Datei / Neuer Datensatz" dem wir sogleich einen aussagekräftigen Namen geben:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Datensatz anlegen

Womit wir auch schon eine neue Tabelle vor uns liegen haben die wir unendlich erweitern können wenn gewünscht:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Datensatz anlegen

Anders als bei PSPP haben wir in Rkward den Editor für die Tabelle sowie die Eingabe der Daten alles in einem Fenster. Oben findet sich der Editor für die Daten-Tabelle und unten die Eingabe für die Daten-Sätze.

Um Einträge in der Tabelle oben zu ändern klicken wir einfach doppelt in das jeweilige Feld, so lässt sich der Eintrag verändern, weitere Möglichkeiten zur Bearbeitung finden sich per Rechtsklick in das jeweilige Feld. Ein Neues Feld erstellen wir ganz einfach indem wir in das Feld unter "Neue Variable" klicken und dieser einen Namen geben.

Wir passen also nötige Variablen zur Konstruktion unserer Tabelle an, in diesem Fall sehr einfach gehalten:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Datensatz anlegen

Haben wir unseren Datensatz angelegt - unter Rkward können Sie die Tabelle selbst übrigens auch ändern ohne die Daten zu beschädigen im Gegensatz zu PSPP / SPSS speichern wir den Arbeitsbereich über den Schalter "Speichern". Wollen wir erst einmal an die Plots gehen - uns also Grafiken zu den Datensätzen ansehen, dazu nutzen wir das Menü "Plots", im Beispiel nutze ich einfach das Säulendiagramm:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Plots erstellen

Wir passen nun die Datensätze entsprechend an und klicken auf "Übermitteln":

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Plots erstellen

Je nach Auswahl der Datensätze und auch Beschriftungen die ich hier nicht sonderlich ausführlich angegeben habe wird der jeweilige Plot nun angezeigt, Sie können die Ansicht wie in einem Webbrowser mit den Tastenkombinationen Strg + + und Strg + - vergrößern und verkleinern sowie über "Datei / Exportieren" oder "Datei / Seite als HTML exportieren" in verschiedenen Formaten exportieren. Sie können das Fenster schließen und einen anderen Plotter wählen - die vorigen Plots werden ebenfalls angezeigt, ist ein Plot als Bild nicht sichtbar hat die Paket-Verwaltung der Software nicht gemerkt das etwas fehlt, dazu gleich mehr oder weiter unten.

Nun kann es vorkommen das der Software diverse Plugins fehlen um Plots auszuführen - in solchen Fällen öffnet sich ein entsprechendes Hinweisfenster:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Zusätzliche Pakete

Klicken Sie auf "OK" und wählen im sich öffnenden Fenster einen Server in Ihrer Nähe:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Zusätzliche Pakete

Und klicken wiederum auf "OK", die Software benötigt einige Sekunden und öffnet das Fenster für zusätzliche Pakete in dem das oder die nötigen schon markiert sind:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Zusätzliche Pakete

Aktivieren Sie die Option "Vorgeschlagene Pakete installieren" rechts unten und klicken auf "Anwenden", sollte etwas nicht funktionieren schließen Sie alle Fenster dieser Paket-Verwaltung und starten den Vorgang mit "Übermitteln" neu und wählen nun den obersten GNU-Server. Die Pakete werden automatisch kompiliert und installiert, warten Sie einfach ab bis die Software die Fertigstellung meldet - Meldungen über Fehler können Sie beim GNU-Server übergehen - kommen immer wieder vor. Über den Schalter "Ausgabe" können Sie die Aktivitäten beobachten. Ist die Schaltfläche "Erledigt" sichtbar klicken Sie darauf

Natürlich sind Grafiken schön zu betrachten, manchmal benötigt man aber einfach nur Daten, Beziehungen zwischen Daten, handfeste Zahlen, ... Dazu nutzen wir das Menü "Analyse":

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Daten-Statistiken auswerten

Und hier bietet GNU R eine ganze Menge, in meinem Beispiel werde ich wieder eine sehr bekömmliche nutzen, die Kreuztabelle, auch hier werden wir wieder dazu genötigt die jeweiligen Daten wie gewünscht zusammen zu fügen:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Daten-Statistiken auswerten
Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Daten-Statistiken auswerten

Auch hier werden natürlich wieder alle Daten gleich in HTML ausgegeben zu denen Sie wieder andere Arten der Ausgabe von Statistiken hinzufügen können.

Plugins für Rkward installieren

GNU R ist extrem umfangreich und für alles vorbereitet, sich jedoch wirklich alles zu installieren kostet natürlich Platz darum hat man die Funktionalität über Plugins gelöst, diese werden entweder als normaler Nutzer installiert - also in seinem Home-Verzeichnis im Konfigurationsverzeichnis der Software oder als Administrator - dies wählt man während der Installation neuer Pakete aus, als Administrator stehen die Plugins dann allen Nutzern am Rechner zur Verfügung.

Sie installieren neue Pakete ganz einfach über die in die Software integrierte Paket-Verwaltung die Sie im Menü "Arbeitsbereich / R Pakete und Module verwalten" finden:

Rkward - grafische Oberfläche für GNU R unter Linux - Professionelle Statistiken - Weitere Pakete installieren

Klicken Sie auf den Reiter "R Pakete installieren / ..." und wählen die entsprechenden Pakete, aktivieren Sie die Checkbox "Vorgeschlagene Pakete installieren" und klicken nun auf "Anwenden", die entsprechenden Pakete werden herunter geladen und installiert.

Da es nun natürlich eine ziemlich stattliche Anzahl solche Pakete gibt und in der Paket-Verwaltung nur deren Bezeichnung steht - man dadurch meist nicht versteht worum es geht findet man hier alle Pakete mit deren Bezeichnung und Beschreibung.

Funktioniert etwas nicht oder es gibt Fehlermeldungen nutzen Sie das Menü "Einstellungen / Rkward einrichten / R-Pakete" und wählen als "Spiegelserver" den obersten GNU-Server.

GNU R

Nicht alles was möglich ist lässt sich auch über die grafische Oberfläche nutzen, wollen Sie etwa Daten von einer Webseite auswerten oder einer Quelle auswerten auf die Sie keinen direkten Zugriff haben lassen sich umfangreiche Daten durch das händische Eintippen nur sehr langsam bewerkstelligen, aber auch so gibt es manchmal Fälle mit denen man keine grafische Oberfläche benötigt. So etwa die automatische Erfassung und Auswertung von Daten, etwa über eine Datenbank von einem Webserver und die gleichzeitige Bereitstellung dieser Daten auf einer Webseite ... Hier hilft nur sich ein wenig mehr mit GNU R zu befassen - und dies kommt nun.