Skip to main content

– ein Beitrag von Prof. Dr. Armin Schmitt, Arbeitsgruppe Züchtungsinformatik am Department für Nutztierwissenschaften und Zentrum für Integrierte Züchtungsforschung

Längst haben wir uns an das blitzschnelle Auffinden der besten Verbindung zwischen zwei Orten per Smartphone gewöhnt oder auch an zielgerichtete Werbung beim Einkaufen im Internet. Dies sind Beispiele für Anwendungen der Datenwissenschaften, üblicherweise Data Science genannt, aus dem Alltagsleben.

Die weitestgehend automatische Datenerhebung und Analyse hat jedoch nicht nur in die Welt der Wirtschaft und des Marketing Einzug gefunden, sondern auch in Bereiche, wo man dies vielleicht weniger vermutet, nämlich in die Agrarwissenschaften. Beim Precision Farming wird z.B. die richtige Menge an Dünger für jede Pflanze individuell bestimmt und verabreicht. Dank Genomischer Selektion gelingt die Vorhersage des genetischen Potentials von Tieren oder Pflanzen bereits in sehr frühen Lebensstadien. Dies sind nur zwei Beispiele aus den Agrarwissenschaften, die die enormen Chancen und Möglichkeiten von Data Science hier aufzeigen.

Photo by Pixabay on Pexels.com

Grundlage dieser Technologien sind riesige Datensätze, meist Big Data genannt, die kontinuierlich und weitestgehend automatisch erhoben werden. Aus diesen Datensätzen, quasi dem Treibstoff der Data Science, gilt es, anwendbares Wissen zu schöpfen. Dies erweist sich jedoch als echte Herausforderung.

Es ist nämlich keinesfalls so, dass mittels Knopfdruck auf eine PC-Tastatur aus den Rohdaten sofort die gewünschten Informationen zur Verfügung gestellt werden. Vielmehr müssen Datensätze mit Informationen unterschiedlichster Art, wie z.B. räumliche Koordinaten, genomische Sequenzen und meteorologische Daten miteinander verknüpft und mit modernen statistischen Verfahren analysiert werden. Die Überprüfung der Qualität der Daten, das Verständnis ihrer Formate, das sichere Speichern sowie die visuelle Darstellung zum besseren intuitiven Verständnis von Analyseergebnissen sind weitere wichtige Schritte einer sogenannten Analyse-Pipeline. 

Photo by Jan Koetsier on Pexels.com

In der Abteilung Züchtungsinformatik unter der Leitung von Professor Armin Schmitt der Fakultät für Agrarwissenschaften der Universität Göttingen beschäftigen sich ForscherInnen in enger Zusammenarbeit mit Arbeitsgruppen aus den Departments für Nutztier- und Nutzpflanzenwissenschaften mit der Nutzbarmachung von Big Data für die Verbesserung von Tier- und Pflanzenzüchtung. So werden beispielsweise aus mehreren 100 Gigabyte oder gar einigen Terabyte umfassenden Sequenzdaten diejenigen genomischen Varianten herausgefiltert, die für wünschenswerte Tier- oder Pflanzeneigenschaften sorgen. Dieses Wissen kann in Zuchtprogrammmen genutzt werden, um die erfolgversprechendsten Individuen für die Reproduktion zu identifizieren. In weiteren Forschungsprojekten werden Verfahren des Maschinellen Lernens angewendet und weiterentwickelt, um aus Kamera-Bildsequenzen anomales Verhalten in Tierbeständen in Echtzeit zu erkennen, damit rechtzeitig geeignete Maßnahmen ergriffen werden können.

Es ist absehbar, dass sich Data Science weiter zum unabdingbaren Träger des Fortschritt in vielen Wissenschaftsgebieten, so auch in den Agrarwissenschaften, entwickeln wird. Dem wird in der Lehre dadurch Rechnung getragen, dass die Studierenden der Agrarwissenschaften schon in einer frühen Phase ihres Studiums erste Erfahrung in der Bearbeitung von Original-Datensätzen gewinnen können. Eine Reihe von neuartigen Bachelor- und Master-Modulen wurde eigens hierfür konzipiert, z.B. „Breeding informatics“, „Applied bioinformatics with R“ oder „Applied Machine Learning in Agriculture with R“. 

 

Keine Kommentare

Kommentar verfassen