Weka’ya Verilerin Yüklenmesi –2


Merhaba arkadaşlar bir önceki yazımda Weka programına giriş yapmıştık. Bu yazımda ise Weka’ya verilerimizi nasıl yükleyeceğimizden bahsedeceğim. Weka, arff  ve csv uzantılı dosyaları desteklemektedir.  Diğer uzantılı dosyalarda çalışmak için arff  formatına verilerimizi nasıl dönüştüreceğimizi bilmekte de fayda var. Direkt olarak ARFF dosya yapısına geçmeden önce excel üzerinde olan verilerin Weka içerisinde kullanımı için öncelikle CSV (Comma-separated values  ) olarak kayıt edilmiş olmaları gerekmekte. Ardından CSV formatındaki verilerimizi Weka’da kullanmak üzere Arff formatına dönüştürmeliyiz. Yani sıralama Excel- Csv- Arff olacak şekilde verilerimizi dönüştüreceğiz.

Öncelikle excel formatında aşağıdaki görselde olduğu gibi Iris veri setimizi kullanacağız. Iris veri seti bu alanda kullanılan popüler veri setlerinden biridir. Knıme örnek uygulamamızı da bu veri seti üzerinde yapmıştık. Buradan o yazıma da ulaşabilirsiniz.

Veri madenciliğinde CSV dosya formatı sıklıkla kullanılmaktadır. Csv, virgülle ayrılmış veriler anlamına gelir. Verileri virgül ile ayırarak belirli bir düzen içerisinde bulunmalarını sağlar. CSV dosya formatını Excel yardımı ile kolayca elde edebiliriz. Exceldeki verilerimizi csv formatına çevirmek için Dosya- Farklı Kaydet- Csv (Virgülle Ayrılmış) adımlarını takip ederek csv formatında kaydediyoruz.

Kaydetmiş olduğunuz Csv dosyasını  bir text editör yardımı ile açtığınızda ben Notepad++ ile açmayı tercih ettim aşağıdaki şekilde gözükecektir. Gördüğünüz gibi verilerimiz virgül ile ayrılmış durumda. Şimdi yapmamız gereken verilerimizi arff formatına çevirmek.

Bir ARFF dosyası @relation, @attribute ve @data bölümlerinden oluşur.

Relation(İlişki) : Veri setimize bir isim verdiğimiz alandır.

Attribute(Özellik):  Programlama mantığında olduğu gibi bir değişken belirleyerek o değişkenin veri tipini yazdığımız alandır. Weka’daki özellikler şunlardır ;

 

Numeric : Sayısal veriler için kullanılır.

Real : Tüm reel sayısal değerleri içerir.

String : Metinsel veriler için kullanılır.

Nominal :  Kümesel değerlerdir.(0-1)

Date : Tarihi veriler için kullanılır.

Data(Veri)  : Elimizde var olan veriler topluluğudur.  @data’dan sonra ise verilerimiz,  daha önceki satırlarda tanıttığımız özelliklerin sırasında yazılır.

Bunlarıda öğrendiğimize göre verilerimizi CSV formatından ARFF formatına çevirdiğimizde aşağıdaki şekilde gözükecektir:File- Save as – Iris.arff şeklinde kaydettikten sonra weka formatında gelen simgenin üzerine tıkladığınızda aşağıdaki şekilde verilerinizin yüklendiğini göreceksiniz.

 

Böylelikle elimizdeki veri setimizi nasıl arff formatına çevireceğimizi öğrenmiş olduk. Bir sonraki yazımda Weka üzerinde örnek bir uygulama yapacağız. Takipte kalın 🙂

Weka’ya Verilerin Yüklenmesi –2

Giriş Yap

Hoşgeldin
Don't have an account?
Kayıt Ol

Şifreni Yenile

Back to
Giriş Yap

Kayıt Ol

Ekimize Katılmaya Hazırmısın

Back to
Giriş Yap
Choose A Format
Personality quiz
Series of questions that intends to reveal something about the personality
Trivia quiz
Series of questions with right and wrong answers that intends to check knowledge
Poll
Voting to make decisions or determine opinions
Story
Formatted Text with Embeds and Visuals