Conversione di un personaggio in una data con SAS

Il sistema di analisi statistica, noto anche come SAS, come suggerisce il nome, serve principalmente come strumento software per l’analisi statistica. SAS è anche un software di programmazione utilizzato per la manipolazione dei dati, l’immagazzinamento, il mining e la gestione. È un linguaggio di soluzioni aziendali utilizzato in un’ampia varietà di aree, tra cui previsione, contabilità, inventario e gestione delle risorse umane. La sintassi e i comandi di programmazione di SAS sono in una certa misura simili a quelli del linguaggio C.

Variabili

Le variabili sono contenitori utilizzati in un programma per memorizzare e gestire i dati. La programmazione SAS consente tre tipi di variabili: carattere, numerico e data. Le variabili carattere contengono caratteri alfabetici, cifre numeriche da 0 a 9 e caratteri speciali come il punto interrogativo e il segno del dollaro. Le variabili numeriche contengono tutti i tipi di valori numerici inclusi numeri interi, valori decimali e numeri mobili. Le variabili di data contengono informazioni su mese, anno e giorno in un ordine predefinito. Quando si dichiarano variabili in un programma “$” indica una variabile di carattere e una dichiarazione come “mmddyy” indica una variabile di dati.

Lettura dei dati in SAS

I dati dai database vengono letti nel motore SAS utilizzando il comando “Input”. Ad esempio, considera un file di testo grezzo contenente dati sui voti degli esami. Una riga di dati nel file dei voti degli esami appare così: 08222011johnsmith90A. Il seguente programma SAS può aiutare a organizzare i dati:

Input @ 1 Exam_Date mmddyy8. @ 9 First_Name $ 10. @ 19 Last_Name $ 10. @ 29 Exam_Score 2. @ 29 Exam_Grade $ 1. ;

Il modo in cui le variabili sono assegnate ai valori nel file di testo, è chiaro che “08” è il mese, “22” è il giorno e “2011” è l’anno. Allo stesso modo, il nome è “John” e il cognome è “Smith”. Il punteggio dell’esame per John Smith è “90” e il voto dell’esame è “A.”

Variabile di data

Come mostrato nella sezione 2, “mmddyy8” è la sintassi di dichiarazione per una variabile di data. Nell’esempio precedente, restituirà il valore 08/22/2011, dove “mm” sta per mese, “gg” per giorno, “aa” per anno e la cifra “8” indica la lunghezza variabile. Se la variabile della data è dichiarata come “mmddyy6” significa che l’anno nel testo dei dati è espresso in due cifre.

In un programma SAS, un valore di data può anche essere dichiarato come variabile numerica o come variabile di carattere. Ecco la data dichiarata come variabili numeriche:

Input @ 1 mese 2. @ 3 giorni 2. @ 5 anni 4.;

Di seguito è riportata la data dichiarata come variabile di carattere: Input @ 1 date_str $ 8. ;

Conversione di Charecter in Date

Il comando per convertire una variabile carattere in una variabile data è: D = INPUT (SUBSTR (NAME, POSITION, LENGTH), MMDDYY.);

La funzione “substr” in SAS descrive la posizione, la lunghezza e il nome di una variabile carattere. Nella sintassi precedente, “substr” identificherà gli elementi della variabile carattere e la funzione “Input” cambierà questi elementi in un formato “mmddyy” e lo convertirà in una variabile di dati indicata come “D.” Consente di richiamare la sintassi del passaggio 3, che descriveva la data come una variabile carattere:

Input @ 1 date_str $ 8.
;

Qui, “date_str” è il nome della variabile. Inoltre, “@ 1” denota la posizione e “$ 8” denota la lunghezza della variabile carattere. Il comando seguente converte questa variabile di carattere in una variabile di data.

Data = Input (substr (date_str, 1, 8), mmddyy.);