Basit öğe kaydını göster

dc.contributor.advisorBostancı, Gazi Erkan
dc.contributor.authorPaker, Ahmet
dc.date.accessioned2019-11-01T12:27:25Z
dc.date.available2019-11-01T12:27:25Z
dc.date.issued2019
dc.identifier.urihttp://hdl.handle.net/11727/4184
dc.description.abstractNowadays, with the increase in biological knowledge, the use of deep learning in bioinformatics and computational biology has increased. Newly, deep learning is widely used to classify and analyze biological sequences. In recent years, deep neural network architectures such as Convolutional and Recurrent Neural Networks have been developed in order to achieve more successful results when compared to classical machine learning algorithms. In this thesis, the discussed problem is a bioinformatics problem. Therefore, it is discussed whether the given microRNA molecule binds to the mRNA molecule. MicroRNAs (miRNAs) are non-coding and small RNA molecules of ~23 base length that play an important role in gene expression cycle. After transcription, they bind to target mRNAs and cause mRNA cleavage or translation inhibition. Rapid and efficient determination of the binding sites of miRNAs is a major problem in molecular biology. In this thesis study, Long Short Term Memory (LSTM) network which is based on deep learning, has been developed with the help of an existing duplex sequence model. The study provides a comparative approach based on different data sets and configurations. In addition, a web tool has been developed to effectively and quickly identify human microRNA target sites and provide a visual interface to the end-user. Compared to the six classical machine learning methods, the proposed LSTM model gives better results in terms of some evaluation criteria. Günümüzde, biyolojik bilgideki artışla birlikte, biyoenformatik ve hesaplamalı biyolojide derin öğrenme kullanımı artmıştır. Derin öğrenme biyolojik dizileri sınıflandırmak ve analiz etmek için yaygın olarak kullanılmaktadır. Son yıllarda klasik makine öğrenme algoritmalarına kıyasla daha başarılı sonuçlar elde etmek için Konvolüsyonel ve Tekrarlayan Sinir Ağları gibi derin sinir ağ mimarileri geliştirilmiştir. Bu tezde tartışılan problem bir biyoenformatik problemidir. Bu sebeple, verilen mikro RNA molekülünün mRNA molekülüne bağlanıp bağlanmadığı tartışılmaktadır. MikroRNA'lar (miRNA'lar) gen ekspresyonunda önemli bir rol oynayan ~ 21-23 baz uzunluğundaki kodlayıcı olmayan RNA molekülleridir. Transkripsiyondan sonra, mRNA'ları hedef alırlar ve mRNA yıkımına veya translasyon inhibisyonuna neden olurlar. miRNA'ların bağlanma bölgelerinin hızlı ve etkili bir şekilde belirlenmesi moleküler biyolojide büyük bir sorundur. Bu tezde, mevcut bir dubleks sekans modeli yardımıyla Uzun Kısa Süreli Belleğe (LSTM) dayanan derin bir öğrenme yaklaşımı geliştirilmiştir. Çalışma, farklı veri kümeleri ve yapılandırmalarına dayanan karşılaştırmalı bir yaklaşım sunmaktadır. Ek olarak, insan miRNA hedef bölgelerini etkili ve hızlı bir şekilde tanımlamak ve son kullanıcıya görsel bir arayüz sağlamak için bir web arayüzü geliştirilmiştir. Altı klasik makine öğrenme yöntemiyle karşılaştırıldığında, önerilen LSTM modeli bazı değerlendirme kriterleri açısından daha iyi sonuçlar verir.en_US
dc.language.isoengen_US
dc.publisherBaşkent Üniversitesi Fen Bilimleri Enstitüsüen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectDeep Learningen_US
dc.subjectRNNen_US
dc.subjectLSTMen_US
dc.subjectmiRNAen_US
dc.subjectmiRNA target siteen_US
dc.titleDeep learning for biological sequencesen_US
dc.typemasterThesisen_US


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster