Gesundheit

Deep learning-powered „DeepEC‘ hilft genau zu verstehen, Enzym-Funktionen

Ein deep-learning-powered computational framework, der „DeepEC,“ können Sie das high-quality-und high-throughput-Vorhersage der Enzym-Kommission zahlen, die notwendig für das genaue Verständnis der Enzym-Funktionen.

Ein team von Dr. Jae Yong Ryu, Professor Hyun-Uk Kim, und Distinguished Professor Sang Yup Lee am KAIST berichtet der computational framework powered by deep learning, die vorhersagt, enzyme commission (EC) Nummern mit hoher Präzision in einem Hochdurchsatz.

DeepEC nimmt ein protein-Sequenz als Eingabe-und genau vorhersagt EC-Nummern, die als output. Enzyme sind Proteine, katalysieren biochemische Reaktionen und EC-Nummern, die aus vier level-Nummern (d.h., ein.b.c.d) zeigen biochemische Reaktionen. So ist die Identifikation von EC-Nummern ist entscheidend für den genauen Verständnis Enzym-Funktionen und den Stoffwechsel.

EC-Nummern sind in der Regel gegeben, um eine protein-Sequenz-Codierung eines Enzyms während eines Genom-annotation-Verfahren. Wegen der Bedeutung der EC-Nummern, mit der mehrere EG-Nummer Prognose-tools, die entwickelt wurden, aber Sie haben Raum für weitere Verbesserungen mit Bezug auf Rechenzeit, Genauigkeit, Abdeckung, und die Gesamtgröße der Dateien, die notwendig für die EG-Nummer Vorhersage.

DeepEC verwendet drei convolutional neural networks (CNNs) als ein wichtiger Motor für die Vorhersage von EC-Nummern und implementiert auch Homologie-Analyse für die EG-Nummern, wenn die drei CNNs nicht zuverlässige EG-Nummern für eine bestimmte protein-Sequenz. DeepEC entwickelt wurde mithilfe eines gold-standard-Datensatz deckt 1,388,606 protein-Sequenzen und 4,669 EC-Nummern.

Insbesondere benchmarking-Studien der DeepEC und fünf weitere Vertreter der EG-Nummer Prognose-tools zeigte, dass DeepEC gemacht, die präziseste und Schnellste voraussagen für die EC-Nummern. DeepEC auch die kleinsten Speicherplatz für die Umsetzung, das es einen idealen Drittanbieter-software-Komponente.

Darüber hinaus DeepEC war die empfindlich für die Erkennung von enzymatischen Funktionsverlust als Folge von Mutationen in den Domänen/binding site Rückstand von protein-Sequenzen; in diese vergleichende Analyse, alle Domänen-oder Bindungsstelle Rückstand ersetzt wurden, mit L-Alanin-Rückstand zur Entfernung der protein-Funktion, die bekannt ist als die L-Alanin-scanning-Methode.

Diese Studie wurde online veröffentlicht in der Proceedings of the National Academy of Sciences der Vereinigten Staaten von Amerika (PNAS) am 20. Juni 2019 mit dem Titel „Deep learning ermöglicht eine hohe Qualität und hoher Durchsatz Vorhersage der Enzym-Kommission zahlen.“

„DeepEC kann verwendet werden als ein eigenständiges tool und auch als eine Drittanbieter-software-Komponente in Kombination mit anderen computational Plattformen, die untersuchen, Stoffwechsel-Reaktionen. DeepEC ist online frei verfügbar“, sagte Professor Kim.

Distinguished Professor Lee sagte, „Mit DeepEC, ist es möglich geworden, mit immer wachsenden Mengen von protein-Sequenz-Daten effizienter und genauer.“

Diese Arbeit wurde gefördert durch die Technologie-Entwicklung-Programm Lösen Klimaänderungen auf Systeme Metabolic Engineering für die Bioraffinerie vom Ministerium für Wissenschaft und IKT durch die National Research Foundation of Korea. Diese Arbeit wurde gefördert durch die Bio-& Medizintechnik-Entwicklung-Programm von der National Research Foundation of Korea finanziert von der koreanischen Regierung, das Ministerium für Wissenschaft und IKT.