Linux'ta karmaşık veriler nasıl görselleştirilir?

03/07 2021
İçindekiler
  1. Kurulum
  2. biraz veri al
grafen molekülleri
(Resim: © Shutterstock.com / Production Perig)

Muhtemelen , verilerinizi dizine eklemenizi ve ardından hızlı bir şekilde arama yapmanızı sağlayan arama motoru Elasticsearch'ü (yeni sekmede açılır) duymuşsunuzdur . Elasticsearch'ün GUI'si Kibana'da, şık arayüzde işaret edip tıklatarak birkaç görselleştirme oluşturmuş olabilirsiniz. 

Timelion ( opens in new tab ) adlı daha az bilinen bir görselleştirme ( yeni sekmede açılır ) eklentisini kullanmamış olabilirsiniz .

Timelion, grafikleri görüntülemek için sorgularınızı basit ve güçlü ifade dilinde yazmayı mümkün kılan harika bir görselleştirme oluşturma aracıdır. Nüfus artışı veya web sitenize yapılan ziyaretler gibi zaman serisi verilerini görüntülemek için kullanılır (yeni sekmede açılır)

Bu makale hakkında

Bu makale ilk olarak Kasım 2020'de yayınlanan Linux Format Magazine Sayı 269'da yayınlandı.

Timelion ile hareketli ortalamaları hesaplayabilir, geçen hafta ve bugünün verileri arasındaki farkı görüntüleyebilir ve bazı temel anomali tespiti yapabiliriz. Nasıl çalışılacağını bilmek için yararlı bir araçtır. Başlayalım.

Kurulum

Normal bir Linux Formatı okuyucusuysanız , LXF261'de bir küme kurmak için  docker (yeni sekmede açılır) oluşturma örnekleri vardır .

Aksi takdirde, Elasticsearch ve Kibana'yı yüklemek nispeten basittir. Tek gereksinim, zaten yüklemiş olabileceğiniz Java'dır. 

Basit bir sudo apt install default-jre değilse, onu Debian tabanlı dağıtımlara yükler (yeni sekmede açılır) veya bir sudo dnf install java, Red Hat dağıtım ailesi için aynısını yapmalıdır.

Ardından , istediğiniz işletim sistemi tadı için Elasticsearch ve Kibana'nın  en son sürümünü (yeni sekmede açılır) indirmeniz yeterlidir .

Yazma sırasında en son sürüm kibana-7.8.1-linux-x86_64.tar.gz'dir

Tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz ile çıkartabilir , çıkarılan dizine geçebilir ve Kibana örneğini başlatmak için  ./bin/kibana & komutunu çalıştırabilirsiniz.

Elasticsearch'ü kurmak için tam olarak aynı adımları uyguladığınızda, 'elasticsearch' yerine 'kibana'yı değiştirdiğinizde, en sevdiğiniz tarayıcıda http://localhost:5601'e gidebilmeli ve oynayabileceğiniz parlak yeni bir Kibana arayüzü görebilmelisiniz. ile etrafında. 

Paketleri bir paket yöneticisi ile kurmayı tercih ederseniz, önceki bağlantının aynısı, Elastic deposunu sisteminize ekleme ve Kibana ve Elasticsearch paketlerini bu şekilde yükleme hakkında bilgi içerir.

Timelion'un ekran görüntüsü

biraz veri al

Kibana'nın son sürümleri, bir komut dosyası veya Logstash yapılandırması oluşturmaya ihtiyaç duymak yerine Veri Görüntüleyici ile veri kümelerini otomatik olarak kümemize almayı mümkün kılar. JSON veya CSV biçimindeki veri kümelerinin yanı sıra Apache günlükleri gibi bazı standart günlük dosyalarıyla da ilgilenebilir. Tek sınırlama, boyutlarının 100 MB'tan küçük olmalarıdır. Bu bizim amaçlarımız için fazlasıyla yeterli. 

AB Açık Veri Portalından dünya çapındaki Covid-19 vakaları veri setini kullanacağız (yeni sekmede açılır) . CSV dosyasını sayfanın Kaynaklar bölümünden indirdik. 

Sorun yaşarsanız, bunun yerine Excel .xlsx sürümünü indirmeyi seçebilir, LibreOffice Calc ile açıp Metin CSV(.csv) biçiminde kaydedebilirsiniz. Alternatif olarak kullanabileceğiniz, indirebileceğiniz bir JSON sürümü de bulunmaktadır.

Kibana'da Veri Görüntüleyici'ye ulaşmak için sol üstteki hamburger simgesine, ardından Makine Öğrenimi'ne ve son olarak Veri Görüntüleyici'ye tıklayın. Verileri içe aktar kutusunda Dosya yükle'ye tıklayın, ardından bir dosyayı seçin veya sürükleyip bırakın ve alınacak csv dosyanızı seçin. 

Kısa bir analizden sonra, CSV dosyasının ilk 1.000 satırından keşfedilen bazı istatistikleri gösterecektir. Bu, metin, tarih veya sayı gibi alanların her birinin içinde olduğunu düşündüğü biçim olacaktır ve alanlarda bulunan en yüksek değerleri vurgulayacaktır.

Bunu bizim için çözmek genellikle iyi bir iş çıkarır. Herhangi bir ayarlama yapmanız gerekirse, örneğin Elasticsearch'te ayarlanacağı şekliyle alanın adını değiştirmek için Ayarları Geçersiz Kıl'a tıklayabilirsiniz. 

Geçersiz kılmamız gereken bir alan adı , veri kümemizde hesaplanan rakamın tarihini temsil eden dateRep'tir . Timelion bunu varsayılan olarak zaman alanı olarak nasıl kullanacağını bilmeyecektir, bu yüzden bu alanı şimdi tanıyacağı bir şeye yeniden adlandırarak hayatımızı daha sonra basitleştirebiliriz. 

İyi bir aday zaman damgasıdır . Bunu ayarlamak için Uygula'yı tıklayın. Geri kalanının nasıl göründüğünden memnun olduğunuzda, alttaki İçe Aktar'a tıklayın, dizine bir ad verin - biz covid'i seçtik - ve ardından verileri kümenize almak için tekrar İçe Aktar'a tıklayın.