Ders videolarının içerik tabanlı erişimi
Abstract
İnternet teknolojisinin ve içerik sağlayıcıların artmasıyla birlikte tüm dünyada ders videolarında da diğer videolarda olduğu gibi büyük bir artış gerçekleşmiştir. Covid 19 salgınının dünyayı etkisi altına alması hem çevrimiçi eğitim içeriğinin artmasına hem de uzaktan eğitimin hızlı bir şekilde artmasına sebep olmuştur. Video sayılarında bu yüksek artış hızı öğrencilerin video içeriklerine erişimini çok zorlaştırmıştır. Bu çalışmada önerilen yöntemler videoların içerik tabanlı erişimini sağlamak üzerinedir. Ders videoları metinsel, işitsel ve görsel içeriğe sahiptir. Bu çalışma için 110 videoluk bir ders videosu veri kümesi oluşturulmuştur. Veri kümesindeki ders videolarının metinsel içerikleri Optic Character Recognition (OCR) teknolojisi ile çıkarılmıştır. Bu çıkarılan içerikler üzerinden 3 adet geleneksel makine öğrenimi yöntemi ve 1 adet derin öğrenme yöntemi ile sınıflandırma gerçekleştirilmiştir. Kullanılan geleneksel makine öğrenimi yöntemleri Support Vector Machine, Naive Bayes ve Random Forest yöntemleridir. Kullanılan derin öğrenme yöntemi ise Long Short Term Memory yöntemidir. Bu çalışma, makine öğrenme yöntemlerinin ve derin öğrenme yönteminin ders videolarının içerik tabanlı erişimde kullanılabilmesi için bir yaklaşım önermektedir.
By the development of the internet technology and increasing internet providers have risen the amount of lecture videos as well as the other type of contents. While the impact of Covid 19 Pandemic around all over, that also changed the road map of education. Both the number of online educational content and the distance learning source and demand have increased alot. This rate of increase in the content and providers made it difficult to reach exact contents at its finest. The methods suggested in this study aim content based access to videos. Lecture videos have textual, audio and visual content. In order to illuminate this study, a lecture video dataset with 110 videos was created and the textual contents of the lecture videos in the Data Set were extracted by Optical Character Recognition (OCR) technology. Classification has done by three traditional machine learning methods and one deep learning method. Traditional machine learning methods applied in this study are Support Vector Machine, Naive Bayes and Random Forest methods. The deep learning method applied is the Long Short Term Memory method. In this study it is intended using machine learning and deep learning approaches to reach content based lecture videos.