Zum Inhalt springen

Python

Python gilt als Standard für viele Anwendungen im Bereich Data Science und Machine Learning. Neben der simplen und sprechenden Syntax sind in Python auch viele Werkzeuge und Bibliotheken enthalten, die im Machine Learning zum absoluten Standard gehören und teilweise auch weit darüber hinaus gehen.

Bibliotheken in Python

Python arbeitet vorwiegend mit sogenannten Bibliotheken, die jedem User mit einer einfachen Installation schnell zur Verfügung stehen. Bei diesen Modulen handelt es sich um Python Code, den andere Entwickler geschrieben haben und der es anderen Nutzern ermöglicht komplexere Funktionen innerhalb weniger Zeilen Code aufrufen zu können.

Einige unserer Beiträge im Bereich Python

Python lernen: Der komplette Leitfaden für Anfänger

Einleitung: Python lernen ohne Vorwissen Wenn du python lernen möchtest und bisher wenig oder keine Programmiererfahrung hast, ist dieser Leitfaden für dich geschrieben. Du erfährst, was Python ist, welche Grundlagen wirklich wichtig sind und wie du Schritt für Schritt sinnvoll übst. Python wirkt am Anfang oft einfacher als andere Programmiersprachen, weil der Code gut lesbar… Weiterlesen »Python lernen: Der komplette Leitfaden für Anfänger

Machine Learning mit Python: Komplettes Tutorial mit Scikit-Learn

Machine Learning mit Python: Was dich in diesem Artikel erwartet Machine Learning mit Python zu betreiben ist heute zugänglicher als je zuvor – und Scikit-Learn ist dabei die Bibliothek, die den Einstieg so reibungslos wie möglich macht. In diesem Tutorial lernst du, was Machine Learning überhaupt ist, welche Grundkonzepte du wirklich verstehen musst und wie… Weiterlesen »Machine Learning mit Python: Komplettes Tutorial mit Scikit-Learn

cloudbasierte repositories

Wie Ingenieurteams Build-Fehler durch cloudbasierte Repositories reduzieren

Cloudbasierte Repositories senken die Zahl der Build-Fehler, weil sie eine einheitliche, zentrale und stark automatisierte Umgebung für die Softwareentwicklung bereitstellen. Wenn der Build-Prozess von lokalen Entwicklerrechnern in die Cloud verlegt wird, verschwinden Inkonsistenzen – das bekannte „Auf meinem Rechner funktioniert es“-Problem. Diese Systeme erzwingen standardisierte Build-Konfigurationen, verwalten Abhängigkeiten genau und nutzen strenge Zugriffskontrollen (IAM). So… Weiterlesen »Wie Ingenieurteams Build-Fehler durch cloudbasierte Repositories reduzieren

Python Programming Basics / Python Tutorial

Python Tutorial für Anfänger

Beherrschen Sie die Grundlagen mit diesem Python Tutorial. Erfahren Sie mehr über Syntax, Datentypen, Kontrollstrukturen und mehr.

Python Variables / Python Variablen

Was sind Python Variablen?

Eintauchen in Python Variablen: Erforschen Sie Datenspeicherung, dynamische Typisierung, Scoping und Tipps für effizienten Code.

Jenkins

Was ist Jenkins?

Jenkins beherrschen: Rationalisieren Sie DevOps mit leistungsstarker Automatisierung. Lernen Sie CI/CD-Konzepte und deren Umsetzung.

Mithilfe eines einfachen “Import” Statements können diese Bibliotheken in das eigene Projekt integriert werden und anschließend alle Funktionalitäten des Moduls genutzt werden. Für eine einfachere spätere Bearbeitung kann man den Bibliotheken anschließend Abkürzungen zuordnen, über die man dann auf das Modul referenzieren kann.

# Variante 1: Import *Modulname* 
import pandas
import numpy

# Variante 2: Import *Modulname* as *Modulabkürzung*
import pandas as pd
import numpy as np

Wichtige Data Science Bibliotheken

Eine Vielzahl von verschiedenen Modulen ermöglicht erst die einfache Data Science Arbeit mit Python, sodass man sich voll auf den Datensatz konzentrieren. Einige der wichtigsten sind hier im Überblick aufgeführt:

  • Pandas bietet verschiedene Datenstrukturen und die Möglichkeit standardisiert aus verschiedenen Dateiformaten, wie beispielsweise CSV, Daten extrahieren zu können.
  • Numpy ist ein starkes Tool für nahezu alle mathematischen Problemstellungen inklusive Vektorrechnung und mathematischer Funktionen, wie die Fourier Transformation.
  • Matplotlib hilft bei der Darstellung von Datenanalysen mit statischen, dynamischen und interaktiven Diagrammen.
  • Seaborn basiert auf Matplotlib und rundet dessen Angebote ab mit verschiedenen statistischen Diagrammtypen, die in Matplotlib nicht verfügbar sind.
  • SkicitLearn bietet statistische Methoden, wie Klassifizierung oder Regression, an um datenbasierte Vorhersagen treffen zu können.

Populäre Machine Learning Bibliotheken

Der große Vorteil von Machine Learning Anwendungen in Python ist, dass große Unternehmen, wie Google, Meta (Facebook) oder Twitter die Bibliotheken selbst nutzen und diese auch entwickelt haben. Somit kann man als “einfacher” Nutzer diese kostenlos nutzen. Darüber hinaus stellen die Unternehmen teilweise auch eigene Entwicklungen dort schnell nach Veröffentlichung frei zur Verfügung. Beispielsweise das sehr trainingsintensive T5-Modell von Google ist bereits über die Bibliothek Transformers verfügbar.

  • Tensorflow ist wahrscheinlich die bekannteste Bibliothek zur Erstellung und zum Training von allen Arten von Machine Learning Modellen.
  • Pytorch bietet ähnliche Funktionalitäten wie Tensorflow. In vielen Fällen ist es eine Geschmacksfrage, ob man Pytorch oder Tensorflow nutzt.
  • Keras fällt unter die Tensorflow API, wird aber trotzdem weiter als eigenständige Bibliothek geführt.
Das Bild zeigt die Python Module Tensorflow, Pytorch und Keras für Machine Learning Anwendungen.
Logos der Python Module

Zusammenfassung

In diesem Kapitel versuchen wir die genannten Bibliotheken und die wichtigsten Methoden verständlich zu erklären. Wenn Du gerne noch darüber hinausgehen möchtest oder Dir Python schon geläufig ist, findest Du ausführliche Anwendungsbeispiele in der Rubrik Use Cases.

... oder abonniere unseren Newsletter!

Wir versenden keinen Spam! Lies die Details gerne in unserer Datenschutzrichtlinie nach.

Cookie Consent mit Real Cookie Banner