Wer mithilfe der Programmiersprache R Daten verarbeitet, kann Datensätze direkt selbst erstellen. In den meisten Fällen aber werden die Daten aus anderen Quellen importiert. Wir zeigen die Vorgehensweise und die Möglichkeiten.
Erfolgreich nach RStudio importierte Daten.
(Bild: RStudio / Joos)
Es gibt verschiedene Möglichkeiten, um Daten in R zu importieren. In vielen Fällen werden CSV- oder XLS-Dateien für den Import verwendet. Generell ist es empfehlenswert die Quelldateien für den Import in einem Verzeichnis auf dem Rechner zu speichern, dass zu dem entsprechenden R-Projekt gehört. So besteht die Möglichkeit, die Datenbasis jederzeit zu verifizieren oder neu einzulesen, wenn das notwendig ist.
Packages für Funktionsaufrufe vorbereiten
Daten lassen sich mit R auch als Funktionsaufruf importieren, wobei hierfür das Package „readr“ benötigt wird. Dann stehen verschiedene Funktionen zur Verfügung:
Damit die Befehle aus diesem Package verwendet werden können, muss es zunächst integriert und geladen werden. Die explizite Installation von readr kann über folgenden Befehl erfolgen.
install.packages("readr")
Ein besserer Ausgangspunkt ist es aber, die komplette Data-Science-Paketsammlung Tidyverse zu installieren, dies gelingt analog dazu mit dem Befehl:
install.packages("tidyverse")
Die Funktionen werden dann innerhalb der R Session einmal mittels „library(tidyverse)“ bzw. „library(readr) geladen. Werden Daten über die grafische Oberfläche importiert, erkennt RStudio die fehlenden Pakete und ermöglicht deren Installation über die GUI. Dazu gehören auch die beiden erwähnten Packages.
RStudio kann Excel-Tabellen (*.xls, *.xlsx) auch ohne eine vorhandene Excel-Installation öffnen und anzeigen. Wenn Excel-Tabellen importiert werden, muss zwingend das Package „readxl“ geladen werden. Der Code für das Importieren von Daten aus einer Excel-Tabelle sieht zum Beispiel folgendermaßen aus:
Daten in RStudio mit der grafischen Oberfläche importieren
In den meisten Fällen ist es beim einmaligen Importieren von Daten einfacher und auch effektiver, wenn die grafische Oberfläche von RStudio genutzt wird, um Daten zu importieren. Der Vorteil besteht darin, dass die Daten nicht nur importiert, sondern zuvor auch noch einmal angezeigt werden. Wer Daten häufiger importieren muss, ist mit einem Skript natürlich besser bedient, weil sich hier die Vorgänge automatisieren lassen.
Die Import-Möglichkeiten im RStudio sind über den Menüpunkt „File\Import Dataset“ zu finden. Hier sind eigene Menüpunkte für den Import von Excel-Tabellen, Text-Dateien oder anderen Quell-Daten zu finden. Über die Registerkarte „Environment“ können ebenfalls Daten importiert werden. Hier stehen über die Schaltfläche „Import Dataset“ die gleichen Optionen zur Verfügung, wie bei „File\Import Dataset“.
Teilweise werden für das Importieren von Daten noch aktuelle Versionen der notwendigen Packages benötigt, zum Beispiel „haven“ und „Rcpp“. Sind diese nicht installiert, zeigt das RStudio diese an und ermöglicht auch gleich die Installation.
Importvorgang steuern und ausführen
Wenn die Daten zum Import ausgewählt werden, zeigt RStudio die eingelesenen Daten bei „Data Preview“ an. Im unteren Bereich können noch Einstellungen für den Importvorgang ausgewählt werden. Auf der rechten Seite ist der Quellcode zu sehen, mit dem die Daten importiert werden.
Wird eine Option geändert, sind die Auswirkungen bei „Data Preview“ zu sehen. Außerdem zeigt das RStudio bei „Code Preview“ den entsprechenden Code an. Wenn zum Beispiel die Option „First Row as Names“ verwenden, liest R die Daten der ersten Zeile nicht aktiv ein.
Welche Optionen das RStudio für den Import anzeigt, hängt davon ab, welche Daten importiert werden. Beim Importieren von SPSS-Datensätzen (Statistical Package für Social Science) kann zum Beispiel nur der Name ausgewählt werden. Abhängig von dem importierten Datensatz erhalten die Daten auch unterschiedliche Attribute.
Über die Schaltfläche „Import“ werden die Daten eingelesen. Auf der Registerkarte „Environment“ ist bei „Data“ die Bezeichnung des Data Frames zu sehen. Dabei handelt es sich um die gerade importierten Daten. Der Name wird als Option beim Importieren der Daten festgelegt. Für den Import wird der Code verwendet, der bei „Code Preview“ zuvor angezeigt wurden.
SPSS-Daten importieren
Wer im Bereich der SPSS mit Open-Source-Software arbeiten will, kann zum Erstellen der Importdatei auch mit GNU PSPP arbeiten. GNU PSPP ist ein Open Source-Programm zur statistischen Analyse von Daten. Das Tool ist ein freier Ersatz für das proprietäre Programm IBM SPSS. GNU PSPP steht für Windows, Linux und macOS zur Verfügung.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Mit dem Tool lassen sich SAV-Dateien erstellen, die R wiederum über das RStudio importieren kann. Dadurch haben Entwickler die Möglichkeit Daten zuvor anzupassen, bevor diese in RStudio importiert werden können. Für das Importieren von SPSS-Dateien wird das Package „haven“ benötigt. Ist dieses auf dem Computer nicht verfügbar, kann es mit dem folgenden Befehl heruntergeladen und im RStudio importiert werden:
install.packages("haven")
SPSS-Dateien können zum Beispiel mit dem folgenden Code importiert werden:
Mit dem RStudio ist es auch möglich, Daten aus einem Data Frame zu bearbeiten und anschließend als RData-Datei zu speichern. Diese Dateien können wiederum im RStudio neu geladen werden. Gespeichert werden die Daten eines Frames mit der Funktion „save()“ Die Syntax dazu ist:
save(<Name des Frames>, file = "<Pfad zur RDA-Datei>")