Analysis of Daily Visitor Numbers of a Web Page by Time Series Method Based on Artificial Neural Networks


Creative Commons License

Yücel A.

EGE 5TH INTERNATIONAL CONFERENCE ON APPLIED SCIENCES, İzmir, Turkey, 21 - 22 May 2022, pp.38

  • Publication Type: Conference Paper / Summary Text
  • City: İzmir
  • Country: Turkey
  • Page Numbers: pp.38
  • Ankara Yıldırım Beyazıt University Affiliated: Yes

Abstract

Web pages are documents written in HTML codes with a clear and simple design that can be

accessed with a browser. They are effectively used in all fields, from education to commerce.

Internet users who access these documents are called visitors. Website owners regularly

monitor visitor statistics to make the right decisions about advertising, content, design, etc. In

this way, real-time observations and predictions can be made for future planning. A time series

analysis (TS) can be expressed as a statistical analysis of time indexed observations. In this

study, the number of visitors to a website was analysed using a TS model based on artificial

neural networks (ANN). The dataset of the study includes information such as the number of

daily visitors to the website such as new first-time visitors, and returning visitors for 5 years

between 2014-2020. Based on the results of the time series analysis, distinctive distribution

patterns (seasonality) were identified that recur during specific time intervals such as school or

holiday periods, specific days of months, or weeks. A 5-fold cross-validation method was used

in the study. According to the preliminary results, it was found that the similarity rate of real

data and predictively created data based on the TS model was in the range of 81-83%.

Bir tarayıcı tarafından erişilebilen açık ve basit tasarımlı, HTML dilinde yazılmış belgeler olan

web sayfaları, eğitimden ticarete her alanda etkin şekilde kullanılmaktadır. Bu belgelere erişen

internet kullanıcılarına ziyaretçi denir. Web sayfası sahipleri, reklam, içerik, tasarım vb.

konularda doğru kararlar alabilmek için, ziyaretçi istatistiklerini düzenli olarak takip ederler.

Bu sayede, hem gerçek zamanlı bir gözlem yapabilmek, hem de geleceğe yönelik planlamalar

için, tahminlerde bulunabilmek mümkün olacaktır. Bir zaman serisi (ZS) analizi, zamana göre

indekslenmiş gözlemlere ait istatistiksel analiz olarak ifade edilebilir. Bu çalışmada, bir web

sayfasının ziyaretçi sayıları Yapay Sinir Ağları’na (YSA) dayalı ZS kullanılarak analiz

edilmiştir. Çalışmanın veri kümesi, bir web sitesinin, 2014-2020 yılları arasında 5 yıl boyunca,

günlük ziyaretçi, ilk defa gelen yeni ziyaretçi ve tekrar ziyaret eden ziyaretçi sayıları gibi

bilgileri içermektedir. Zaman serisi analiz sonuçlarına göre, okul veya tatil dönemi, ayların veya

haftaların belli günleri gibi, sabit zaman aralıklarında tekrar eden belirgin dağılım modelleri

(mevsimsellik) tespit edilmiştir. Çalışmada, 5 katmanlı çapraz doğrulama yöntemi

kullanılmıştır. İlk sonuçlara göre, ZS modeline dayalı tahminsel olarak üretilen ve test

kümesinde yer alan gerçek verilerin benzerlik oranının %81-83 aralığında olduğu

gözlemlenmiştir.