Otomotiv endüstrisinde makine öğrenimi teknikleri kullanılarak araç fiyatlarının tahmin edilmesine yönelik karşılaştırılmalı bir çalışma
Özet
Pazarlamada doğru tahminlerin yapılabilmesi, finansal getirisi daha yüksek sonuçlar almak ve stratejik kararların daha doğru verilebilmesi açısından önemlidir. Sadece uzman görüşü ile yapılan tahminler yanlış veya yetersiz olabilir ve şirketlere büyük maddi zararlar verebilir. Bu çalışmada, popüler makine öğrenmesi teknikleri ile otomotiv endüstrisindeki araç fiyatları tahmin edilerek bu soruna bir çözüm sunulmaktadır. Son yıllarda literatürde başta moda ürünleri, perakende/pazar ürünleri olmak üzere bilgisayar, elektronik ürünler ve çevrimiçi ürün satışlarının fiyat tahmininde makine öğrenmesi teknikleri kullanılmaktadır. Bu çalışmada, Karar Ağacı, Rastgele Orman, Destek Vektörü, ve Yapay Sinir Ağları yöntemlerinin bir otomotiv satış veri seti üzerindeki performansları değerlendirilmiş ve karşılaştırılmıştır. Deneylerde, 13 özellikli (seri numarası, yeni fiyat, model, konum, yıl, gidilen kilometre, yakıt türü, şanzıman, araç sahibi türü, kilometre, motor, güç, koltuk, fiyat) ve 6019 örnek içeren bir satış veri seti kullanılmış ve üç aşamalı bir ön işlem uygulanmıştır. Bu ön işlemenin son aşamasında Sıralı, One Hot, İkili ve Frekans kodlama yöntemleri ile kategorik değerler sayısal verilere dönüştürülmüştür. Tüm analizlerde fiyat tahmin hatasının hesaplanmasında K-Katlamalı Çapraz Doğrulama yöntemi kullanılmıştır. Yapılan deneyler sonucunda kullanılan veri seti üzerinde en iyi sonucu veren kodlama yöntemi ile en iyi tahmin yöntemi karşılaştırmalı olarak ortaya konmuştur. Sonuçlar, bu çalışmayı ilgili uygulamalar için potansiyel bir seçim haline getiren bazı ilginç noktalar sunmuştur.
Precise estimations in marketing is important in terms of getting results with higher financial returns and making more accurate strategic decisions. Estimations made only by expert opinion can be incorrect or insufficient and cause great financial damage to companies. In this study, a solution to this problem is presented to forecast vehicle prices in the automotive industry by using popular machine learning techniques. In recent years, machine learning techniques have been used in the literature for price estimation of computer, electronic products and online product sales, mainly fashion products, retail/market products. In this study, performances of Decision Tree, Random Forest, Support Vector, and Artificial Neural Networks regression techniques on an automotive sales dataset are evaluated and compared. In experiments, a sales dataset of 6019 samples with 13 features (serial number, new price, name, location, year, mileage driven, fuel type, transmission, owner type, mileage, engine, power, seats, price) was used, and a three-stage pre-processing was applied. In the last stage of this pre-processing, categorical values were converted into numerical data by Label, One Hot, Binary and Frequency coding techniques. In all analyses, K-Fold Cross Validation method was used in the estimation of price prediction error. As a result of the experiments, the best coding and the best estimation method on this data set were revealed comparatively. The results have presented some interesting points which makes this study a potential choice for relevant applications.