Obwohl die Bedeutung von machine-learning-Methoden in der Genom-Forschung stetig gewachsen ist in den letzten Jahren haben Forscher oft musste greifen, um eine veraltete software. Wissenschaftler in der klinischen Forschung oft nicht über den Zugang zu den neuesten Modellen. Dies wird sich ändern mit dem neuen kostenlosen open-access-repository: Kipoi ermöglicht einen einfachen Austausch von machine-learning-Modelle im Bereich der Genom-Forschung. Das repository wurde erstellt von Julien Gagneur, Assistant Professor of Computational Biology an der TUM, in Zusammenarbeit mit Forschern von der University of Cambridge, Stanford University, dem europäischen Bioinformatik-Institut (EMBL-EBI) und das European Molecular Biology Laboratory (EMBL).
Ausgebildete Modelle frei verfügbar
„Was macht Kipoi Besondere ist, dass es bietet kostenlosen Zugriff auf machine-learning-Modelle, die bereits ausgebildet worden“, sagt Julien Gagneur. „Was wir tun, mit Kipoi ist nicht nur die gemeinsame Nutzung von Daten und software, aber-sharing-Modelle und die algorithmen sind bereits geschult, auf die wichtigsten Daten. Diese Modelle sind sofort einsatzbereit, da alle die mühsame Arbeit der Anwendung auf Daten, die bereits getan hat“, sagt Anshul Kundaje, Assistant Professor an der Stanford. Mehr als 2.000 ausgebildete Modelle sind derzeit frei zugänglich auf Kipoi. In einer kürzlich veröffentlichten Studie in Nature Biotechnologyzeigen die Forscher, dass das neue repository wird beschleunigen den Austausch in der Genomik-Gemeinschaft und damit Voraus-Genom-Forschung.
Schnelle algorithmen und eine einfache Bedienung
Da Kipoi vereinfacht den Zugriff auf bereits trainierte Modelle, Forscher ausführen können übertragen lernen. Dies bedeutet, dass ein Modell, das schon ausgebildet worden, die mit einem bestimmten Datensatz ist in der Lage zu lernen eine ähnliche Aufgabe schneller. Kipoi vereinfacht auch den Prozess der Fütterung der Daten in die Modelle dort gespeichert: Standardisierte Datei-Formate und software-frameworks reduzieren, die installation und Ausführung eines Modells auf drei einfache Befehle. Diejenigen, die bislang keine Erfahrung in machine learning kann somit auch gut mit dem repository.
Verständnis individueller Genome
Als Kipoi orientiert sich an Modellen, die Verknüpfung von Genotyp und Phänotyp, die neue Plattform wird es leichter zu identifizieren genetischen Ursachen der Erkrankung: „Kipoi setzt die neueste deep-learning-Modelle ausgebildet, die auf massive Genomik-Daten an den Fingerspitzen von klinischen Forschern“, sagt Julien Gagneur. „Dies bietet sehr spannende Möglichkeiten, um zu verstehen, individuelle Genome, zum Beispiel zu lokalisieren, genetische Varianten der Entstehung von Krankheiten oder zu interpretieren vorkommenden Mutationen in Tumoren.“
Allerdings ist das Ausmaß der Plattform Beitrag zur Genom-Forschung wird auch davon abhängen, Genomik Gemeinschaft. „Wir hoffen, dass in Zukunft mehr Forscher bringen Ihre Modelle auf unserem repository“, sagt Oliver Stegle, Gruppenleiter am EMBL-EBI. „Das ist die einzige Möglichkeit, die wir machen können, Genomik Analyse zugänglich und ultimalely eine breitere Palette von predictive machine learning tools zur Verfügung, um die Genomik-Gemeinschaft.“