Come visualizzare dati complessi su Linux

Probabilmente hai sentito parlare di Elasticsearch, il motore di ricerca che ti consente di indicizzare e quindi cercare rapidamente tra i tuoi dati. Potresti aver creato alcune visualizzazioni in Kibana, la GUI per Elasticsearch, puntando e facendo clic per farti strada attraverso l'elegante interfaccia.

Quello che potresti non aver usato è un plugin di visualizzazione meno conosciuto chiamato Timelion.

Timelion è un fantastico strumento per la creazione di visualizzazioni che rende possibile scrivere le tue query nel suo linguaggio di espressione semplice e potente per visualizzare grafici. Viene utilizzato per visualizzare i dati di serie temporali come la crescita della popolazione o gli hit del tuo sito web.

  • Ecco un elenco dei migliori laptop per sviluppatori
  • Dai un'occhiata a queste migliori distribuzioni per gli sviluppatori
  • Calcola i numeri con facilità su queste migliori workstation
A proposito di questo articolo

Questo articolo è apparso per la prima volta su Linux Format Magazine, numero 269, pubblicato a novembre 2022-2023.

Con Timelion, possiamo calcolare le medie mobili, visualizzare la differenza tra i dati della scorsa settimana e quella odierna e rilevare alcune anomalie di base. È uno strumento utile con cui sapere come lavorare. Iniziamo.

Installazione

Se sei un normale lettore di formato Linux, ci sono esempi di composizione docker per la configurazione di un cluster in LXF261.

Altrimenti l'installazione di Elasticsearch e Kibana è relativamente semplice. L'unico requisito è Java, che potresti aver già installato.

Se non un semplice sudo apt install default-jre lo installa su distribuzioni basate su Debian o sudo dnf install java dovrebbe fare lo stesso per la famiglia di distribuzioni Red Hat.

Quindi devi solo scaricare l'ultima versione di Elasticsearch e Kibana per il gusto del tuo sistema operativo desiderato.

Al momento in cui scrivo l'ultima versione è kibana-7.8.1-linux-x86_64.tar.gz.

Puoi estrarlo con tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz, passare alla directory estratta ed eseguire ./bin/kibana & per avviare l'istanza Kibana.

Quando hai eseguito esattamente gli stessi passaggi per configurare Elasticsearch, sostituendo "kibana" con "elasticsearch", dovresti essere in grado di navigare su http: // localhost: 5601 nel tuo browser preferito e vedere una nuova brillante interfaccia Kibana per giocare in giro con.

Se preferisci installare pacchetti con un gestore di pacchetti, lo stesso collegamento di prima contiene informazioni sull'aggiunta del repository Elastic al tuo sistema e sull'installazione dei pacchetti Kibana ed Elasticsearch in questo modo.

Puoi sovrapporre i grafici uno sopra l'altro e utilizzare la formattazione per ottenere i tuoi grafici al meglio.

Ottieni alcuni dati

Le versioni recenti di Kibana consentono di importare automaticamente i set di dati nel nostro cluster con il Visualizzatore dati invece di dover creare uno script o una configurazione Logstash. Può gestire set di dati in formato JSON o CSV, nonché alcuni file di log standard come i log di Apache. L'unica limitazione è che hanno dimensioni inferiori a 100 MB. Questo è più che sufficiente per i nostri scopi.

Utilizzeremo il set di dati mondiale dei casi Covid-19 dal portale Open Data dell'UE. Abbiamo scaricato il file CSV dalla sezione Risorse della pagina.

In caso di problemi, è possibile scegliere di scaricare invece la versione Excel .xlsx, aprirla con LibreOffice Calc e salvarla come formato Text CSV (.csv). È disponibile anche una versione JSON per il download che puoi utilizzare come alternativa.

Per accedere al Data Visualizer in Kibana, fare clic sull'icona dell'hamburger in alto a sinistra, quindi su Machine Learning e infine su Data Visualizer. Una volta lì, fai clic su Carica file nella casella Importa dati, quindi seleziona o trascina e rilascia un file e scegli il file csv da importare.

Dopo una breve analisi, mostrerà alcune statistiche scoperte dalle prime 1.000 righe del file CSV. Questo sarà il formato in cui ritiene si trovi ciascuno dei campi, come testo, data o numero ed evidenzia i primi valori trovati nei campi.

Di solito fa un buon lavoro capirlo per noi. Se hai bisogno di apportare modifiche, puoi fare clic su Sostituisci impostazioni per modificare, ad esempio il nome del campo così come verrà impostato in Elasticsearch.

Un nome di campo che dovremmo sovrascrivere è dateRep, che rappresenta la data per la cifra calcolata nel nostro set di dati. Timelion non saprà come usarlo come campo ora per impostazione predefinita, quindi possiamo semplificare la nostra vita in seguito rinominando questo campo ora in qualcosa che riconoscerà.

Un buon candidato lo è timestamp. Fare clic su Applica per impostarlo. Quando sei soddisfatto di come appare il resto, fai clic su Importa in basso, assegna un nome all'indice (abbiamo scelto covid), quindi fai di nuovo clic su Importa per inserire i dati nel tuo cluster.

Articoli interessanti...